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本 书 从 概念 和 实践 的 角度 详细 论述 了 了 分布 式 操作 系统 的 各 个 主要 方面 ， 包 念 广泛 的 复 法 的 
有 具体 实例 ， 提 供 可 以 实践 的 面向 项 目的 练习 ， 本 书 提 及 的 核心 Web 站 点 、ftp 站 点 和 文献 提供 了 
大 量 参 考 资 料 ， 并 且 包 含 了 实际 操作 系统 的 相关 范例 ， 以 加 深 概 念 和 展示 分 布 式 系统 设计 人 员 
所 需 进 行 的 设计 与 操作 。 最 后 ， 灵 活 的 设计 使 本 书 可 用 于 教学 和 技术 培训 


本 书 的 教学 特点 如 下 : 

供 进一步 深入 理解 的 详细 说 明 ， 包 含 诸如 复杂 算法 和 更 深入 的 例子 等 内 容 。 
Windows 2000 案 例 研 究 ， 展 示 一 个 实际 的 商业 解决 方案 。 

面向 项 目的 习题 提供 有 关 经 验 。 

参考 资料 包括 : 

A. 供 进一步 学 习 的 综述 资料 

B. 研究 论文 

C. 核心 Web 站 点 和 ftp 站 点 

e 一 个 简化 的 分 布 式 应 用 程序 ， 以 展示 分 布 式 程序 设计 的 关键 概念 。 


本 书 的 Web 站 点 为 www.prenhall.com /galli 


. 博士 现在 在 亚特兰大 从 事 远程 通信 的 研究 工作 ， 是 分 布 
Doreen L. Galli #i 算 和 系统 集成 的 专家 。 同 时 ， 作 为 计算 机 科学 的 才 
授 ， 她 曾 讲授 过 关于 高 级 系统 和 网 络 技术 的 许多 课程 。 她 在 Waterloo 大 学 获得 了 博士 学 位 。 
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本 书 从 概念 和 实践 的 角度 详细 论述 了 分 布 式 操作 系统 的 各 个 主要 方面 ， 还 包含 了 实际 
操作 系统 的 相关 范例 已 及 广泛 算法 的 具体 实 俩 ， 其 中 提 及 的 核心 Web 站 点 、ftp 站 点 和 文 
献 提 供 了 大 量 参考 资 灯 :。 此 外 ，Windows 2000 案例 研究 提供 了 一 个 实际 商业 解决 方案 的 例 
子 ， 附 录 中 还 有 一 个 简单 的 CS 实际 应 用 来 演示 关键 的 分 布 式 计算 程序 设计 概念 ， 以 加 深 
概念 并 展示 分 布 式 操作 系统 设计 人 员 所 需 进行 的 设计 与 操作 。 

本 书 内 容 丰富 ， 结 构 合 理 ， 适 于 作为 计算 机 及 相关 专业 的 本 科 生 和 研究 生 的 教材 ， 也 
是 计算 机 从 业 人 员 掌 握 分 布 式 操作 系统 原理 的 理想 读物 。 


Doreen L.Galli; Distributed Operating Systems: Concepts & Practice (ISBN 0-13-079843-6). 
Authorized translation from the English language edition published by Prentice Hall PTR. 
Copyright © 2000 hy Prentice Hall PTR, Inc. 

All nghts reserved. 
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Copyright © 2002 hy China Machine Press. 
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凡 购 本 书 ， 如 有 倒 页 、 脱 页 、 缺 页 ， 由 本 社 发 行 部 调换 


出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 学 
LUT RH, RRA TERRE, SR, MARFA, ROARS 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信 息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 得、 从业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教 材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国外 忧 秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum ，Stroustrup ，Kernighan， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 上 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 圳 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ;而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 针对 本 科 生 的 核心 课程 ， 噜 抉 外 版 芒 华 而 成 “国外 经 典 教 
材 ” 系 列 ; 对 影印 版 的 教材 ， 则 单独 开辟 出 “经 典 原版 书库 ”; 定位 在 高 级 教程 和 专业 参考 
的 “计算 机 科学 丛书 ”还 将 保持 原来 的 风格 ， 继 续 出 版 新 的 品种 。 为 了 保证 这 三 套 丛 书 的 权 
威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 
华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 
哈尔滨 工业 大 学 、 西 安 交通 大 学 、 中 国人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮 电大 学 、 中 山 
大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 北 工 学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重 
点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 的 著名 学 者 组 成 “专家 指导 委员 会 ”， 为 我 们 提供 选 题 
意见 和 出 版 监督 。 


IV 


“国外 经 典 教材 ”是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 本 科教 
学 度 身 订 造 的 。 在 广泛 地 征求 并 听取 丛书 的 “专家 指导 委员 会 ”的 意见 后 ， 我 们 最 终 选 定 了 
这 20 多 种 篇 幅 内 容 适 度 、 讲 解 鞠 用 入 里 的 教材 ， 其 中 的 大 部 分 已 经 被 M.ILT.、Stanford 、U.C， 
Berkley、C.M.U. 等 世界 和 名牌 大 学 采用 。 从 书 不 仪 涵盖 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 
算 机 体系 结构 、 数 据 库 、 编 译 原 理 、 软 件 工程 、 图 形 学 、 通 信 与 网 络 、 离 散 数 学 等 国内 大 学 
计算 机 专业 普遍 开设 的 核心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历 三 十 
年 而 不 衰 、 有 的 已 被 全 世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 
者 必 将 在 计算 机 科学 的 宫 典 中 由 登 堂 而 人 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 ， 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : ( 010 ) 68995265 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 ] 号 
邮政 编码 : 100037 


译 者 & 


近年 来 ， 分 布 式 操作 系统 在 国内 外 都 获得 了 迅猛 的 发 展 ， 成 为 计算 机 科学 与 技术 研究 领 
域 中 的 一 个 热点 ， 同 时 在 商业 应 用 方面 也 取得 了 丰硕 的 成 果 。 学 习 和 研究 世界 上 分 布 式 系统 
最 新 的 理论 和 技术 ， 以 便 在 该 领域 迅速 跟 上 并 超越 国际 水 平 ， 是 我 国 计 算 机 界 义 不 容 辞 的 任 
务 。 因 此 我 们 翻译 了 Doreen L.Galli 博士 的 《分 布 式 操作 系统 : 原理 与 实践 》 一 书 。 

本 书 涵 盖 了 分 布 式 操作 系统 的 所 有 内 容 ， 全 面 地 介绍 了 分 布 式 系统 环境 中 的 内 核 、 通 
信 、 内 存 管理 、 并 发 控制 等 基本 概念 和 算法 ， 并 对 进程 管理 、 文 件 系 统 、 事 务 管理 和 同步 等 
方面 的 高 级 概念 和 算法 进行 了 详细 的 介绍 和 研究 。 

本 书 紧 密 结合 当前 的 最 新 技术 ， 并 对 这 些 技术 进行 了 详细 的 阐述 ， 比 如 基于 对 和 象 的 分 布 
式 操作 系统 、 分 布 式 操作 系统 的 安全 等 ， 同 时 还 给 出 了 具有 实际 意义 的 研究 实例 一 一 Win- 
dows 2000。 它 不 仅 是 计算 机 专业 本 科 生 和 研究 生 的 一 本 很 好 的 教材 ， 对 业界 相关 人 士 的 研究 
开发 工作 也 不 无 神 益 。 

本 书 的 第 1、2 章 及 前 言 等 由 唐 英 翻 译 ， 第 3、4、5 章 由 毛 家 菊 翻 译 , 第 6、7、8 章 由 
当 正 光 翻 译 ， 第 9、10、11 章 由 金 恩 华 翻译 ， 第 .12 章 由 徐 良 贤 翻 译 ， 附 录 程 序 中 的 注释 部 
分 由 邑人 敏 翻 译 。 本 书 前 半 部 分 由 金 恩 华 初 审 ， 后 半 部 分 由 唐 英 初 审 ， 并 由 唐 英 统 排 全 书 。 最 
后 ， 全 书 由 徐 良 贤 教授 审 校 并 统一 给 出 了 词汇 表 。 

在 翻译 过 程 中 我 们 尽量 做 到 尊重 原意 、 翻 译 准确 ， 但 由 于 水 平 有 限 ， 不 当 和 杖 漏 之 处 在 
所 难免 ， 敬 请 广大 读者 不 音 指正 。 





译 者 
上 海 交 通 大 学 电子 信息 学 院 
计算 机 科学 与 技术 系 
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本 书 阅 述 了 分 布 式 计算 的 原理 和 实践 ， 不 仪 适合 学 生 学 习 ， 也 可 供 从 业 人 员 及 公司 培训 之 
用 。 在 过 去 的 十 年 中 ， 计 算 机 系统 日 益 进 步 ， 大 多 数 计算 机 都 是 连接 在 具有 一 致 基础 的 某 种 网 络 
之 中 的 。 小 型 企业 中 安装 局 域 网 越 来 越 普遍 ， 家 庭 安装 的 局 域 网 也 以 越 来 越 快 的 速度 增加 。 软 件 
技术 必须 跟 上 这 一 趋势 ， 当 前 和 未 来 的 从 业 人 员 也 是 如 此 。 按 目前 速度 ， 所 有 计算 机 科研 人 员 掌 
担 分 布 式 系统 的 工作 原理 只 是 个 时 间 问 题 ， 因 为 大 部 分 计算 机 及 其 应 用 都 要 用 到 这 个 技术 。 


本 书 读者 
学 习 标准 操作 系统 概念 对 计算 机 专业 的 大 学 生 特别 重要 ， 同 时 ， 扩 展 分 布 式 操作 系统 知识 也 


是 研究 生 和 大 学 四 年 级 学 生 以 及 业界 工作 人 员 人 迫切 的 和 不 断 增长 的 要 求 。 因 此 ， 很 需要 对 分 布 式 
操作 系统 的 原理 、 实 际 解决 方案 和 方法 进行 研究 。 本 书 就 能 够 满足 学 生 和 从 业 人 员 的 这 方面 需要 。 


目标 


本 书 从 概念 和 实践 的 角度 详细 论述 了 分 布 式 操作 系统 的 各 个 主要 方面 ， 并 且 还 包含 了 实 
际 操作 系统 的 相关 范例 ， 以 加 深 概 念 和 展示 分 布 式 系 统 设 计 人 员 所 必须 作出 的 决定 。 一 些 操 
作 系 统 如 Amoeba, Clouds 和 Chorus (JavaOS 的 技术 基础 ) 在 全 书 中 作为 范例 来 讲解 ， 此 外 ， 
Windows 2000 案例 研究 还 提供 了 一 个 实际 商业 解决 方案 的 例子 。 针 对 分 布 式 计算 的 各 个 方 
面 ， 本 书 用 CORBA, DCOM, NFS, LDAP, X.500, Kerberos, RSA, DES, SSH 和 NIP 等 技术 
说 明 实际 的 解决 方案 。 附 录 中 还 有 一 个 简单 的 C/S 应 用 来 演示 关键 的 分 布 式 计算 程序 设计 概 
念 ， 如 INET 套 接 字 、pthread 和 通过 互 斥 操作 实现 同步 。 

总 之 ， 本 书 着 重 于 分 布 式 系统 的 原理 、 理 论 和 实践 。 本 书 是 为 计算 机 从 业 人 员 、 大 学 四 
年 级 学 生 和 研究 生 编写 多 ， 并 且 假 定 读者 已 经 学 过 基本 的 操作 系统 课程 。 我 们 希望 这 本 书 不 
仅 对 渴望 充电 的 业界 人 员 是 有 益 的 ， 而 且 对 将 本 书 作为 教材 来 学 习 的 学 生来 说 也 是 有 价值 的 。 


内 容 组 织 和 教学 特点 


本 书 分 成 两 部 分 。 从 第 1 章 到 第 6 章 为 第 一 部 分 ， 提 供 分 布 式 计算 的 基础 知识 ， 从 第 7 
章 到 第 11 章 为 第 二 部 分 ， 详 述 这 些 主题 并 更 深入 地 研究 高 级 分 布 式 操作 系统 的 主题 。 书 中 
的 教学 特点 如 下 : 

1. 供 进 一 步 深入 理解 的 详细 说 明 。 这 些 详 细 说 明 中 包含 诸如 复杂 算法 和 更 深入 的 例子 
等 内 容 。 

2. 超过 150 幅 的 图 表 ， 以 图 解 方 式 帮助 阐明 概念 。 
.Windows 2000 案例 研究 ， 展 示 一 个 实际 的 商业 解决 方案 。 
. 面向 项 目的 习题 〈 带 有 斜体 数字 )， 作 为 亲身 体验 。 
. 习题 建立 在 前 面 几 章 的 概念 之 上 。 
. 参考 资料 来 源 包括 : 


nu e U 


A. 供 进一步 学 习 的 综述 资料 。 

B. 研究 论文 。 

C. 核心 web 站 点 和 地 站点。 
7. 一 个 简化 的 分 布 式 应 用 程序 ， 以 展示 分 布 式 程序 设计 的 关键 概念 。 
8. 综合 词汇 表 ， 集 中 给 出 主要 的 定义 。 
9. 缩写 字 的 完整 列表 ， 以 帮助 阅读 并 为 快速 查询 提供 一 个 集中 存放 地 点 。 
10. 各 章 小 结 。 
11. 完整 的 索引 。 
12. 本 书 的 web 站 点 为 www. prenhall.com/galli。 


对 教师 的 建议 


本 书 为 教师 提供 了 最 大 的 灵活 性 ， 并 具有 一 定 的 教学 特点 ， 以 便 教师 能 够 根据 班级 需要 
和 教学 任务 选择 具体 内 容 。 在 写本 书 时 惟一 的 假定 是 读者 已 经 学 过 了 基础 的 操作 系统 导论 课 
程 。 有 些 题材 可 能 在 操作 系统 导论 课程 中 有 所 论述 ， 但 在 本 书 中 有 时 忽略 或 简单 讲述 ， 有 的 
题材 常常 难于 掌握 或 者 可 能 已 经 淡忘 ， 然 而 对 分 布 式 系统 是 很 重要 的 ， 本 书 会 在 适当 的 地 方 
插入 这 些 内 容 。 这 些 材料 不 必 在 课堂 上 讲解 ,但 写 进 本 书 以 保证 学 生 在 学 习 更 高 深 的 分 布 式 
题材 时 具有 必 备 的 基础 知识 。 下 面 是 一 些 建议 ， 指 导 需 要 侧重 实践 的 课程 以 及 要 求 侧重 研究 
的 课程 如 何 使 用 本 书 。 需 要 侧重 学 习 这 两 方面 的 研究 生 课程 可 以 采用 这 两 类 建议 。 更 多 的 信 
息 可 以 在 作者 的 Prentice Hal 网 站 中 获取 ， 地 址 是 www. prenhall. com/galli。 


侧重 实践 


下 面 是 几 个 建议 ， 适 用 于 侧重 实践 的 课程 。 

1. 给 个 别 学 生 或 一 组 学 生 一 个 或 多 个 “项 目 练习 ”。 这 些 练习 在 相关 各 章 最 后 的 练习 题 
中 用 斜体 数字 指明 。 如 果 他 们 的 设计 和 实现 是 在 课堂 上 口述 ， 则 可 以 获得 更 多 的 实践 经 验 。 

2. 阅读 有 关 实 际 实现 的 所 有 详细 说 明 。 

3. 在 课堂 上 学 习 Windows 2000 案例 研究 。 

4. 建立 一 个 个 人 或 小 组 项 目 来 研究 Windows 2000 的 分 布 式 特点 。 

5. 安排 学 生 扩充 或 修改 外 科 手 术 调 度 程序 。 可 以 简单 地 改变 进程 闻 通 信 的 类 型 ， 也 可 
以 复杂 地 利用 同样 的 分 布 式 概念 创建 另 一 个 程序 。 


侧重 研究 


下 面 是 几 个 建议 ， 适 用 于 侧重 研究 的 课程 。 

1. 让 个 别 学 生 或 一 组 学 生 就 分 布 式 操作 系统 的 一 个 专题 写 一 篇 论文 。 每 章 后 面 的 参考 
文献 是 较 好 的 起 点 ， 这 些 练习 可 以 包括 一 个 口头 讲解 。 

2. 展示 一 些 从 相关 REC 中 找到 的 讲授 材料 或 者 每 章 后 面 的 研究 论文 。 这 些 资 料 可 以 从 
web 站 点 中 获取 ， 并 将 它们 列 在 要 求学 生 阅读 的 读物 中 。 

3. 要 求学 生 在 网 上 查找 相关 的 RFC 文献 和 每 章 后 面 的 论文 ， 并 作出 摘要 。 

4. 在 每 章 后 面 引用 的 参考 论文 中 选择 一 部 分 ， 并 创建 一 个 活页 秒 以 在 整个 课程 中 与 此 
书 进行 同步 学 习 。 研 究 机 构 中 的 很 多 书店 可 为 此 提供 所 需 的 版 权 。 
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第 1 章 ”分布 式 系统 引 论 


计算 机 系统 的 进展 从 来 没有 像 开 发 与 创建 分 布 式 计 算 这 样 迅 猛 。 因 此 对 所 有 计算 机 研究 
人 员 深 入 理解 系统 的 要 求 迅 速 增 涨 ， 这 种 一 度 限于 对 计算 机 专家 的 要 求 ， 已 经 在 分 布 式 计算 
技术 中 起 着 前 所 未 有 的 作用 [Nev95]。 在 基本 的 集中 式 计 算 环 境 中 ， 简 单 了 解 一 下 操作 系统 
的 概念 就 金 了 。 但 在 分 布 式 环境 中 的 开发 人 员 往 往 不 仅 要 懂得 分 布 式 和 实时 概念 ， 甚 至 并 行 
系统 ， 还 要 在 更 大 的 范围 中 实现 它们 [SHFECB93]。 个 人 经 验 显 示 ， 在 高 级 环境 中 开发 一 个 
应 用 程序 ， 开 发 团队 常常 要 花费 50% 以 上 的 时 间 来 实现 这 些 高 级 操作 系统 概念 。 


1.1 什么 是 操作 系统 


操作 系统 是 计算 机 的 任务 管理 者 ， 它 控制 、 管 理 、 协 调和 调度 所 有 的 处 理 过 程 和 相应 资 
源 。 资 源 主要 包括 ;: 

+ CPU. 

4 存储 模块 。 

4 媒体 存储 器 (磁盘 驱动 器 、DVD? 、CD - ROM 等 )。 

$ 声卡 和 显卡 。 

4 总 线 和 互联 网 络 。 

4 调制 解 调 器 和 网 卡 。 

4 显示 器 、 终 端 、 打 印 机 和 其 他 输出 设备 。 

9 键盘、 鼠标、 扫描 仪 和 其 他 输 人 设备 。 

操作 系统 的 管理 任务 主要 包括 ， 

4 过 程 (或 对 象 ) 管理 。 

4 通信。 

4 存储 访问 /管理 。 

4 资源 调度 。 

4 信息 和 资源 安全 。 

4 数据 完整 性 。 

4 定时 。 

对 于 这 些 任务 和 部 件 ， 我 们 只 希望 系统 能 创建 一 个 统一 完整 的 视图 或 “图 像 "， 传 统 上 ， 
操作 系统 的 这 些 管 理 任务 都 由 软件 来 负责 ， 但 在 分 布 式 系 统 中 并 不 完全 如 此 。 我 们 讲解 主要 
的 基本 操作 系统 概念 ， 即 使 它们 在 分 布 式 环境 中 是 由 硬件 实现 的 。 

为 了 形象 地 说 明 这 个 问题 对 于 计算 机 科学 家 的 重要 性 和 复杂 人 性， 我 们 可 以 把 操作 系统 看 
作 音 乐 指挥 。 当 然 乐章 越 复杂 ， 指 挥 的 工作 量 和 复杂 性 会 迅速 增加 。 如 果 同 时 指挥 多 个 管弦 





O ”DVD 曾经 是 指数 字 影 碟 (Digital Video Disk) 或 者 数字 多 功能 影碟 (Digital Versatile Disk)。 其 格式 已 结合 到 现在 的 
DVD +, REM DVD 已 经 不 是 一 个 字母 缩写 的 组 合 了 ， 虽 然 人 们 经 常 认 为 它 是 某 种 缩写 。 
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间 限 制 ! 很 显然 这 是 一 个 需 全 面 解 决 的 任务 。 但 不 管 多 复杂 的 任务 我 们 都 可 以 每 次 集中 解决 
一 个 问题 ， 一 次 克服 一 个 障碍 ， 并 最 终 将 揭示 出 全 局 的 图 像 。 在 我 们 知道 最 终结 果 以 前 ， 整 
个 图 像 会 是 清晰 的 ， 展 现 的 是 音乐 般 的 美丽 与 和 谐 ， 而 不 是 混乱 、 噪 声 或 者 杂乱 无 章 的 现 
象 。 作 为 第 一 步 ， 让 我 们 首先 在 1.2 节 到 1.4 节 中 分 别 定义 分 布 式 、 实 时 以 及 并 行 计算 的 


概念 。 
1.2 什么 是 分 布 式 系统 


分 布 式 系统 是 一 组 异 构 计 算 机 和 处 理 器 通过 网 
络 联接 在 一 起 ， 如 图 1-1 所 示 。 整 组 机 器 紧密 配合 
工作 ， 完 成 一 个 共同 的 目标 。 分 布 式 操作 系统 的 目 
标 是 为 文件 系统 、 名 字 空 间 、 时 间 、 安 全 和 资源 访 
问 提供 一 个 共同 的 、 一 至 的 全 局 视图 。 为 了 提供 这 
个 共同 视图 ， 所 有 成 员 系 统 都 有 许多 限制 和 要 求 ， 
因此 分 布 式 系 统 通常 也 称 为 紧 耦 合 系统 (每 个 规则 
总 有 例外 !)。 如 果 蜡 构 计 算 机 系统 通过 网 络 互联 起 
来 ,并 且 不 是 紧 耦 合 的 ， 那 么 通常 称 为 网 络 系统 。 
网 络 系统 不 提供 共同 的 全 局 视图 ， 也 不 对 成 员 系 统 
提出 明显 的 要 求 。 分 布 式 系统 或 网 络 系统 中 的 部 件 
可 以 是 简单 的 集中 式 系统 部 件 ， 或 者 如 1.3 节 所 示 
的 有 实时 限制 的 部 件 ， 黄 至 如 1.4 节 所 介绍 的 更 复 
杂 的 并 行 系统 。 而 且 ， 分 布 式 系统 有 了 时 也 会 同时 结 
合集 中 式 的 部 件 、 实 时 性 的 部 件 和 并 行 性 的 部 件 ， 
在 1.5 节 中 可 看 到 这 样 的 实例 。 








由 于 PC 机 的 每 美元 计算 能 力 在 迅速 提高 ， 网 aes 
络 和 分 布 式 系统 都 在 不 断 普及 。1.2.1 节 介绍 流行 b) be 


的 网 络 ; 1.2.2 节 提 供 一 个 由 国际 标准 化 组 织 CIn- 图 1-1 网 络 环境 中 的 计算 机 
ternational Standards Organization , ISO) 定义 的 开放 式 

系统 互联 (Open System Interconnection, OSI) 参考 模型 ; 1.2.3 节 介 绍 分 布 式 计算 模型 ; 
1.2.4 节 讨论 在 一 个 分 布 式 系统 中 决定 用 分 布 式 还 是 集中 式 解 决 方案 的 有 关 问 题 ; 最 后 ， 
1.2.5 节 描 述 在 分 布 式 环境 中 可 用 的 各 种 计算 模型 。 


1.2.1 流行 的 网 络 拓扑 各 特点 


虽然 整 本 书 和 整个 课程 都 是 关于 网 络 的 ， 但 本 节 只 对 网 络 简要 介绍 一 下 。 和 希望 这 点 最 基 
本 的 介绍 足以 用 来 理解 本 书 要 学 习 的 操作 系统 概念 。 

网 络 有 两 大 基本 类 : 局 域 网 CLAN) 和 广域网 (WAN)。 典 型 的 局 域 网 由 一 个 单位 所 拥 
A, 范围 只 有 几 公 里 。 尽 管 许多 现代 广域网 (比如 AMR) 已 经 大 大 降低 了 错误 率 ， 但 在 
20 世纪 90 年 代 中 期 之 前 ， 局 域 网 的 错误 率 往 往 比 广域网 低 一 千 倍 。 一 个 节点 可 能 有 几 个 子 
网 或 更 小 的 局 域 网 ， 大 的 局 域 网 可 以 由 多 个 小 局 域 网 组 成 。 小 局 域 网 可 能 以 如 下 方式 连接 ， 
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其 算法 可 参见 详细 说 明 1.1。 


详细 说 明 1.1 
| 连接 局 域 网 子 网 的 路 由 器 算法 














A pif p 为 设备 的 两 个 端 o。 

4 OUTPUT (a, b) 将 端口 b 接 到 的 消息 内 容 输 出 到 端口 a 所 连 的 网 络 。 

4 DESTINATION (a, b) 为 真 ， 当 且 仅 当 蝙 已 虽 接 到 的 消息 必须 使 用 端口 b 来 送 达 目的 地 。 

A-DIF_ PROTOCOL (a, b) 为 真 ， BARE a foak E b RARE S A HLE DES- 
TINATION (a, b) AK. 

SCONVERT (a, E) 将 关口 RIAN LALA A Rb mE, 并 发 送 到 
端口 b。 


转发 器 算法 : 
While O 
OUTPUT (PI, P2); PD 接 到 的 所 有 消息 都 输出 到 Pi 
OUTPUT (P2, PL); eee | 

= 


网 桥 算 法 ， 
While €) 
poo 
if DESTINATION (P1, P2); oe : o 

Then OUTPUT (P1, P2); 1/ 仅 在 到 达 目的 地 需要 经 过 的 情况 下 转发 
if DESTINATION (P2, Pl); - oe 
| Then OUTPUT: (P2, P1); 
| 


路 由 器 算法 : 

While © 

i 8 . 

If DIF_ PROTOCOL (Pl, P2); /在 到 过 目的 需要 经过 
Then CONVERT (PI, P2); ` _1/ 只 在 必须 的 情况 下 转换 


Else If DESTINATION (Pt, P2); 
Then OUTPUT (P1, P2); i Meas ALEREEMELTNA 
If DIF. PROTOCOL (P2, P1); 
Then CONVERT (P2, Pt); 
Else If DESTINATION (Pi, P2); 
o 9 Then OUTPUT (P1, P2);. 0: 
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1. 转发 器 : 一 个 非 智能 型 的 设备 ， 只 是 简单 地 将 一 个 网 络 里 的 东西 全 部 转发 到 另 一 个 
网 络 中 去 。 这 两 个 网 络 必须 使 用 相同 的 协议 ， 也 就 是 说 它们 是 同类 型 的 网 络 。 

2. 网 桥 : 一 个 智能 设备 ， 只 将 一 个 子 网 里 的 数据 转发 到 目标 子 网 ， 或 者 到 达 目 标 所 需 
要 经 过 的 子 网 。 这 些 网 络 必 须 实 现 相同 的 网 络 协议 。 

3. 路 由 器 : 比 网 桥 更 先进 之 处 在 于 它 能 连接 使 用 不 同 协议 的 局 域 网 网 段 。 路 由 器 能 同 
时 连接 两 个 以 上 的 网 络 。 

4. 主干 : 不 包含 用 户 的 局 域 网 ， 它 只 连接 其 他 网 络 而 不 连接 用 户 。 如 图 1-2 所 示 。 


C 
Ce 





图 1-2 通过 主干 来 连接 多 个 局 域 网 子 网 


局 域 网 可 以 是 有 线 的 或 无 线 的 。 有 线 局 域 网 通过 物理 线 缆 连接 ， 无 线 局 域 网 通过 无 形 的 
通信 通道 如 红外 线 或 无 线 电 连 接 。 有 线 局 域 网 有 三 种 常用 拓扑 ， 如 图 1-3 所 示 。 其 中 最 常用 
的 两 种 拓扑 是 以 太 网 (在 IEEE802.3 标准 中 的 正式 命名 是 CSMA/CD [IEEE85a]) 和 令 牌 环 网 
(在 TEEE802.5 标准 中 指明 [IEEE85$b]j)。 由 于 这 些 拓扑 提供 的 操作 服务 类 型 根本 不 同 ， 它 们 
之 间 没 有 直接 竞争 。 以 太 网 类 似 于 将 邮票 贴 在 信封 上 ， 而 令 牌 环 网 类 似 于 次 日 发 送 并 要 求 回 
执 。 基 本 以 太 网 运行 在 10Mbps 上 ， 运 行 在 100Mbps 上 的 快速 以 太 网 是 当前 流行 的 版 本 ， 而 
千 兆 以 太 网 则 运行 在 1000Mbps 上 。 以 太 网 以 尽 可 能 快 的 速度 发 送信 息 ， 但 不 确认 信息 是 否 
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被 正确 地 接收 。 而 且 标 准 以 太 网 协议 不 支持 信息 优先 权 ， 也 不 保证 传输 时 间 。 对 大 多 数 应 用 
来 说 ， 它 在 达到 容量 的 50% 之 前 运行 得 很 好 ， 之 后 它 开始 迅速 变 慢 ， 并 且 几 乎 所 有 的 CS- 
MA/CD 网 络 在 超过 约 60% 的 容量 时 将 崩溃 而 无 法 传送 任何 信息 。 


A 


lane 





BAIR Hub 拓扑 
图 1-3 常用 有 线 局 域 网 拓扑 结构 


令 牌 环 模拟 带 回执 的 次 日 传送 ， 能 确认 所 有 信息 被 正确 送 达 。 它 允许 优先 级 并 保证 传 
输 时 间 ， 这 使 它 对 实时 应 用 特别 有 吸引 力 。 与 以 太 网 不 同 ， 令 牌 环 网 在 高 负荷 时 也 不 会 崩 
省 ， 而 是 继续 顺利 地 发 送信 息 。 这 个 协议 是 考虑 优先 权 的 公平 访问 。 令 牌 环 网 依 所 用 种 类 不 
同 ， 运 行 在 4 到 16Mbps ŻE, I 10 Base? 以 太 网 同一 个 档次 ， 但 实现 成 本 是 以 太 网 的 两 倍 。 

光纤 分 布 式 数据 接口 〈Fiber Distributed Data Interface, FDDI) 是 另 一 种 常用 网 络 协议 ， 经 
常用 于 主干 或 高 速 局 域 网 。FDDI 操作 在 100Mbps， 其 实现 是 建立 在 两 个 反 相 令 牌 环 网 上 。 这 
个 协议 设计 支持 同步 信息 流 ， 因 此 对 实时 应 用 很 有 吸引 力 。 

无 线 局 域 网 由 于 不 断 增长 的 移动 需求 和 有 线 局 域 网 固定 的 重 配 置 费 用 而 变 得 越 来 越 普 
遍 。 无 线 局 域 网 通常 有 一 个 较 高 的 初 装 成 本 ， 但 维护 成 本 较 低 。 无 线 局 域 网 可 以 是 基于 无 线 
电 ， 也 可 以 是 基于 红外 线 。 基 于 无 线 电 的 局 域 网 当前 可 达 4Mbps， 并 且 容 易 安装 ， 因 为 无 线 
电信 号 能 穿 过 不 透明 的 物体 传播 ， 但 这 也 意味 着 网 络 信号 传 到 建筑 物 之 外 。 因 此 基于 无 线 电 
的 局 域 网 有 时 不 如 有 线 局 域 网 或 红外 线 局 域 网 安全 。 不 过 ， 由 于 传播 频谱 技术 的 利用 ， 信 号 
可 以 以 吹 音 的 方式 传播 或 者 令 信号 不 断 跳 频传 播 ， 这 样 无 线 电 局 域 网 也 可 以 更 加 安全 。 此 
外 ， 有 线 局 域 网 所 采用 的 各 种 安全 手段 如 第 11 章 的 加 密 技术 ， 也 可 以 用 于 无 线 电 局 域 网 。 
红外 线 局 域 网 如 今 可 达 10Mbps， 但 红外 线 信号 不 能 穿 过 不 透明 物体 。 这 一 点 使 红外 线 局 域 
网 很 难 安装 ， 因 为 发 送 器 和 接收 器 必须 在 一 条 直线 上 并 且 相 互 可 见 。 而 且 红外 线 信 号 可 能 受 
SCREW TH, TTE, 

许多 分 布 式 系 统 并 不 是 在 局 域 网 ， 而 是 在 广域网 。 要 将 一 个 局 域 网 连接 到 一 个 广域网 ， 
需要 用 到 网 关 。 信 息 发 送 到 网 络 上 在 传输 之 前 被 分 成 更 小 的 片 ， 称 做 帧 或 包 。 有 两 个 常用 的 
方法 可 以 用 来 在 广域网 上 发 送 这 些 包 。 第 一 个 方法 是 电路 交换 ， 用 于 公用 交换 电话 网 (pub- 
lic-switched telephone network，PSTN)。 这 类 网 络 在 进行 任何 数据 传输 之 前 提供 一 个 固定 的 数据 





© 10Base 以 太 网 一 般 指 运行 在 10Mbps 下 的 以 太 网络 。 
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速率 通道 ， 这 个 保留 的 通道 完全 用 于 当前 的 数据 传输 。 这 个 方法 需要 大 量 的 设置 时 间 并 降低 
了 网 络 吞 吐 量 ， 但 能 保证 一 个 信息 在 其 传输 过 程 中 只 有 传输 延迟 。 第 二 个 方法 是 包 交 换 。 每 
个 信息 被 分 成 称 为 包 的 小 单元 ， 包 的 大 小 有 固定 的 上 限 。 它 们 可 以 使 用 一 个 虚拟 电路 以 面向 
连接 的 方式 发 送 ， 也 可 以 使 用 数据 报 以 无 连接 的 方式 发 送 。 虚 拟 电 路 要 求 同 一 个 信息 的 每 个 
包 都 沿 着 同样 的 路 径 按 焉 常 顺序 传输 ， 这 通常 要 求 先 发 送 一 个 设置 包 。 相 反 ， 数 据 报 对 相关 
包 的 传输 路 径 和 次 序 不 作 限 制 ， 在 目的 地 把 收 到 的 数据 报 依 正 常 次 序 重新 排列 ， 并 再 组 装 成 
原始 信息 。 这 个 方法 可 洁 性 较 绊 ， 但 更 健壮 和 高 效 。 

广域网 常用 的 网 络 协 议 包括 帧 中 继 和 蜡 步 传输 模式 (asynchronous transfer mode, ATM) 。 
帧 中 继 允 许 网 络 消息 包含 拥塞 控制 和 速率 信息 ， 以 便 在 网 络 过 于 繁忙 时 琅 掉 该 消息 。ATM 
网 络 以 速度 和 支持 多 媒体 文件 传输 而 著称 ， 尽 管 这 些 特点 并 非 ATM 网 络 所 独 有 。ATM 网 中 
的 每 个 包 尺 十 相同， 都 是 53 字 节 。ATM 网 把 这 些 53 字 节 的 包 称 作 单元 (cell)。 通 过 使 用 不 
同 的 帧 格式 ，ATM 适应 层 (ATM adaptation layer, AAL) 支持 固定 位 速率 和 可 变 位 速率 传输 ， 
以 及 面向 连接 和 无 连接 污 输 。 它 在 设计 时 考虑 了 支持 实时 多 媒体 应 用 。 当 然 ， 像 Intemet 这 
样 的 广域网 使 用 了 所 有 网 络 类 型 的 组 合 。 


1.2.2 ISO/OSI 参考 模型 


ISO/OSI 参考 模型 [ISO84」 描述 了 在 各 种 网 络 模型 中 所 执行 的 所 有 计算 任务 的 一 种 可 能 
划分 。 这 个 参考 模型 如 图 1-4 所 示 划 分 成 七 层 ， 层 数 越 低 越 接近 网 络 。 第 一 到 第 三 层 依赖 网 











Ej 全 向 应 用 的 层 
[EE 依 天 网 络 的 层 
i) RR 


图 1-4 ”ISO/0SI 参考 模型 
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络 ， 与 眼 系统 直接 面 对 的 具体 网 络 协议 密切 相关 。 第 五 到 第 七 层 是 面向 应 用 的 ， 第 四 层 是 介 
于 网 络 和 应 用 之 间 的 传输 层 。 操 作 系统 概念 始 于 第 四 层 的 接口 ， 包 括 了 第 五 至 第 七 层 。 这 个 
参考 模型 与 nemet 所 用 的 传输 控制 协议 /互联 网 协议 (TCP/IP) 的 协议 族 关系 参见 详细 说 明 
1.2。 现 在 我 们 简要 定义 和 描述 180/09 参考 模型 的 七 个 层次 


详细 说 明 1.2 | g 
TCP/IP 协议 族 与 ISO/OSI 4858 

















”TCP/IP 协议 族 是 一 组 设计 用 来 访问 异 构 网 络 或 互联 网 的 协议 。TCP/IP 最 初 是 20 世纪 
60 年 代为 政府 投资 的 高 级 军事 研究 项 目 网 (ARPANET) 而 设计 的 (此 时 ISO/OSI 还 没有 出 
H), EA 1978 年 才 演 进 碟 今天 这 样 的 在 互联 网 上 普遍 采用 的 形式 (ARPANET 最 初 的 协 
议 是 网 络 控制 程序 一 一 NCP)。 当 互联 网 (internet) 术语 的 首 字 符 写成 大 写 的 1 时 ， 专 指 
因特网 (Intemet)。1983 年 第 一 个 包含 了 TCP/IP 的 UNIX 版 本 发 布 ， 为 家 用 PC 机 环境 提 
` 供 的 第 一 个 包含 了 TCP/IP 的 Windows 版 本 :(Windows95) 在 1995 年 发 布 。TCP/IP 分 成 四 
Ko RLS 显示 了 这 四 层 与 ISO/OSI 参考 模型 的 关系 。 下 面 描述 这 四 个 层 。 





! 
一 一 人 EREA 


物理 层 





TCP/IP ISO/OSI 


图 1.5 TCP/IP 与 IO/OsI 参考 模型 的 关系 


1, RBA: 链 路 技 是 最 低 的 层 ， Let ISO/OSI 4 BRAK AE, 从 字面 上 看 ， 
这 意味 着 网 卡 和 该 卡 所 用 的 操作 系统 设备 驱动 器 在 这 一 层 中 。 
2， 网 络 层 :网络 层 是 倒数 第 二 层 ， 直 接 上 映射 到 ISO/OSI 参考 模型 中 的 网 络 层 。 这 一 











说 (IP), MERMERI (ICMP) 和 网 际 组 管理 协议 (ICMP)。 
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3. HE: 对 应 于 BOOS 参考 模型 的 传输 层 。 该 层 有 传输 控制 协议 (TCP) 和 用 户 
数据 报 协议 (UDP)。TCP 提供 包括 确认 机 制 的 可 靠 传输 ， 是 一 小 高 级 类 别 的 服务 。 另 一 
方面 UDP 只 管 发 送 包 ， 由 上 面 的 层 负责 解决 可 靠 性 问题 。 作 为 一 种 低级 类 别 的 服务 ， 
UDP 以 高 效 著 称 ， 常 为 实 RAMEE. ERAT, 应 用 程序 必须 自己 负责 实现 所 
需要 的 可 车 性。 

4, BAR: 应 用 县 对 应 于 JISO/0SI 参考 模型 最 高 的 三 个 层次 。 该 协议 中 的 服务 包括 
远程 会 话 的 telnet， 文 件 传输 协议 (FTP), 使 用 简单 邮件 传输 协议 (SMTP) 的 email, % 
竺 服务 器 协议 (NSP) ， 以 及 简单 网 络 管理 协议 (SNMP), 











1. 物理 层 。 物 理 层 是 最 低 的 层 ， 负 责 向 线路 上 发 送 位 。 所 有 协议 都 关注 一 个 适配器 上 
有 多 少 个 连接 器 。 电 气 工程 师 对 此 层 尤 感 兴趣 。 

2. 数据 链 路 层 。 对 于 局 域 网 而 言 ， 数 据 链 路 层 分 成 两 个 子 层 : 媒体 访问 控制 和 逻辑 链 
路 控制 。 逻 辑 链 路 控制 不 是 局 域 网 所 独 有 的 ， 它 使 用 协议 来 确认 和 重 发 帧 ， 以 此 作为 一 种 错 
误 控 制 方法 。 数 据 链 路 层 也 负责 流 控制 ， 控 制 网 络 上 信息 传输 的 数量 和 速度 。 因 此 流 控制 可 
帮助 防止 网 络 及 其 资源 的 “过 载 ”。 由 于 局 域 网 是 一 种 共享 的 广播 媒体 ， 因 此 我 们 必须 使 用 
协议 来 达到 有 效 的 和 高 效 的 利用 。 常 用 的 协议 包括 CSMA/CD (ARRA) 和 令 牌 环 协议 ， 如 
1.2.1 节 中 所 述 。 

3. 网 络 层 。 网 络 层 主要 功能 是 为 一 条 信息 从 源 地 到 目的 地 进行 路 由 。 由 于 局 域 网 上 无 
须 路 由 ， 因 而 该 层 在 局 城 网 环境 下 是 空 的 ， 六 提供 任何 功能 。 

4. 传输 层 。 传 输 层 的 首要 任务 是 判定 在 网 络 上 通信 所 必需 的 服务 类 别 。 最 高 一 类 的 服 
务 被 认为 是 面向 连接 的 ， 并 提供 完全 的 错误 控制 和 确认 服务 。 最 低 一 类 的 服务 是 无 连接 的 ， 
在 该 层 上 不 提供 这 桩 的 错误 恢复 服务 。 

5. 会 话 层 。 该 层 控 制 源 地 和 目的 地 在 整个 通信 期 间 的 相关 组 织 工作 和 同步 协调 。 

6. 表示 层 。 该 层 负 责 消息 数据 的 语法 ， 并 执行 相应 的 转换 。 它 包括 在 ASCII 码 和 EBC- 
DIC 码 之 间 的 转换 ， 如 压缩 和 加 密 等 。 

7. 应 用 层 。 应 用 层 的 主要 功能 是 提供 用 户 界面 ， 建 立 授 权 ， 以 及 资源 的 管理 和 使 用 。 

ISO/OSI 参考 模型 分 妇 概 念 的 另 一 个 重要 特点 是 点 对 点 层 与 对 等 层 。 点 对 点 层 中 的 功能 
在 源 地 和 目的 地 以 及 源 地 和 目的 地 之 间 的 每 个 中 间 节 点 执行 。 因 为 可 能 有 上 千 个 节点 处 于 源 
地 和 目的 地 之 间 ， 消 息 从 源 地 向 目的 地 传输 的 过 程 中 ， 点 对 点 的 功能 就 可 能 需要 执行 上 千 
次 。 第 一 层 到 第 三 层 中 定义 的 所 有 功能 都 是 点 对 点 的 。 对 等 层 (第 四 层 到 第 七 层 ) 中 的 功能 
只 在 源 地 和 目的 地 执行 ， 总 共 两 次 。 作 为 一 个 点 对 点 的 功能 的 例子 ， 让 我 们 来 看 看 检查 信封 
地 址 的 功能 。 这 个 功能 在 投 寄 局 执行 ， 也 在 收 信 和 局 执行 ， 还 在 投 寄 局 和 收 信和 局 之 间 的 所 有 中 
转 局 执行 。 而 且 在 目的 地 收 信和 局 和 邮递 员 都 要 看 信封 地 址 。 最 终 ， 目 的 地 执行 检查 地 址 的 功 
能 以 确定 实际 接收 和 信 。 相 反 ， 阅 读 信件 内 容 的 功能 则 (希望 1) 只 由 发 信人 和 收 信人 来 做 ， 
因此 这 是 一 个 对 等 功能 的 例子 。 


1.2.3 分 布 式 计 算 模型 


有 一 名 老话 说 :“ 厨 坛 多 了 搞 坏 汤 。” 因此 分 布 式 计算 的 重要 问题 是 如 何 管理 所 有 这 些 厨 ， 
是， 以免 搞 坏 了 汤 。 分 布 式 计 算 有 两 个 主要 方法 : C/S 模型 和 对 等 模型 。C/S 模型 因 简 洁 而 
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非常 流行 ; 对 等 模型 是 更 高 级 的 模式 ， 正 随时 间 的 推移 而 越发 普及 。 

C/S 模型 

C/S 模型 很 象 企业 中 的 经 理 / 下 属 
模型 。 客 户 是 经 理 ， 而 服务 器 是 下 
属 。 客 户 想 做 某 件 事 ， 并 把 这 个 任务 
交 给 服务 器 。 服 务 器 去 完成 这 个 任 
务 ， 并 通知 它 的 老板 ， 也 就 是 客户 。 
客户 向 服务 器 提交 请 求 ， 服 务 器 回应 








客户 ， 如 图 1-6 所 示 。 这 个 操作 发 生 7 
在 ISO/OSI 模型 的 会 话 层 。 它 通过 进 = HER 9 
程 间 通信 来 实现 ， 相 关内 容 将 在 第 4 (2) = aps 12 
章 讲 述 。 在 CS 模型 中 ， 可 以 有 几 个 

图 1-6 CS 模型 


客户 向 几 个 服务 器 提交 请 求 。 同 样 ， 
某 个 服务 器 可 以 满足 多 个 客户 的 请 求 。 在 本 地 环境 ， 有 两 个 基本 方法 来 实现 C/S 模型 ， 工 作 
站 模型 和 处 理 器 池 模 型 。 
工作 站 模型 多 许 每 个 本 地 用 户 有 一 个 小 型 工作 站 ， 这 个 工作 站 本 身 没有 足够 计算 能 力 来 
完成 用 户 要 求 的 任务 。 当 需要 更 多 能 力 时 ， 用 户 的 工作 站 通过 网 络 发 出 一 个 请 求 ， 希 望 找到 
另 一 个 空闲 的 工作 站 以 协同 工作 。 这 种 模型 本 身 带 来 一 系列 问题 ， 相 关 讨 论 在 第 7 章 进 行 。 
在 处 理 器 池 模 型 中 ， 兵 给 每 个 用 户 一 个 简单 的 终端 ， 所 有 处 理 能 力 都 集中 在 一 处 ， 就 像 
大 型 机 。 需 要 资源 时 ， 用 户 向 服务 器 发 出 一 个 请 求 。 服 务 器 控制 所 有 的 处 理 能 力 和 服务 ， 以 
及 这 些 能 力 和 服务 的 分 布 。 这 方面 的 讨论 也 在 第 7 章 进 行 。 
对 等 模型 
对 等 模型 是 C/S 模型 的 自然 演进 。 它 类 似 于 一 群 同事 在 一 起 工作 ， 计 算 组 的 每 个 成 员 可 
以 向 其 他 成 员 提交 服务 请 求 。 因 此 C/S 模型 可 当 作 是 对 等 模式 的 简化 和 前 身 。 一 些 应 用 要 求 
使 用 对 等 模型 ， 以 提供 多 对 多 关系 。 如 [BCEF94] 中 所 指出 ， 分 布 式 系统 可 能 需要 一 个 大 
型 数据 库 来 存储 所 有 设备 和 主机 的 信息 ， 这 就 需要 管理 部 件 来 管理 和 优化 使 用 数据 库 的 系 
统 。 同 样 ， 数 据 库 系统 也 需要 管理 部 件 来 优化 分 布 式 请 求 。 这 里 ， 哪 个 是 客户 ， 哪 个 是 服务 
器 ? 都 不 是 。 大 家 要 像 在 对 等 环境 中 的 同事 那样 一 起 工作 ， 如 图 1-7 所 示 。 注 意 : 一 个 环境 [13 | 
om E 


— ~ 


S sa a 一 一 2 一 一 
-一 一 人 系统 在 做 什么 ? 
F -一 


奇数 是 诸 求 这 是 数据 。 
个 数 是 回应 (4) 





图 1-7 对 等 模型 
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如 果 支 持 对 等 协作 ， 也 并 不 排除 C/S 模型 ， 因 为 有 些 工 作 并 不 需要 团队 工作 方法 。 支 持 对 等 
模型 的 是 一 种 被 称 为 平 衔 配 置 的 方法 。 

对 等 架构 的 例子 有 实现 ISO/OSI 数据 链 路 层 中 逻辑 链 路 控制 子 层 的 高 层 数 据 链 路 控制 协 
议 。 这 个 协议 在 异步 平衡 方式 上 操作 时 支持 对 等 模型 ， 并 在 一 个 被 称 为 X.25 的 标准 中 实现 
To IBM 的 高 级 对 等 网 络 (APPN) 也 支持 对 等 计算 。 由 于 这 些 架构 的 进一步 细节 超出 了 操 
作 系 统 的 范围 ， 我 们 不 在 此 详细 讨论 ， 感 兴趣 的 读者 可 以 在 本 书 中 找到 更 多 关于 X.25、 高 
层 数据 链 路 控制 和 APPN 的 信息 ， 如 1-7 节 中 所 列 出 的 一 些 参考 资料 。 


1.2.4 分 布 式 与 集中 式 和 解决 方案 


分 布 式 环境 中 ， 多 种 任务 的 解决 可 以 选择 分 布 式 或 集中 式 解决 方案 。 集 中 式 解决 方案 把 
整个 决策 及 与 决策 有 关 的 各 种 信息 都 放 在 一 个 位 置 上 。 这 类 解决 方案 是 最 简单 的 解决 ， 也 是 
改编 非 分 布 式 系统 算法 的 最 容易 方法 。 但 这 坚 有 几 个 严重 缺点 : 首先 ， 中 央 管 理 单元 就 变 成 
关键 单元 ， 一 且 关 键 单元 甬 溃 ， 整 个 分 布 式 系统 也 就 失效 了 ;， 第 二 ， 中 央 管 理 单元 周围 的 网 
络 流量 将 增长 ， 因 为 系统 中 所 有 成 员 都 不 得 不 跟 这 个 位 置 通信 。 但 从 积极 的 一 面 看 ， 集 中 式 
架构 中 应 用 软件 的 升级 倒是 变 得 相当 简单 了 ， 因 为 只 有 一 个 系统 需要 新 软件 。 

相对 来 说 ， 分 布 式 解决 方案 虽 不 受 关键 部 位 之 累 ， 但 也 有 其 缺点 。 分 布 式 解决 方案 常常 
增 大 了 整个 网 络 中 的 流量 ， 因 为 许多 分 布 式 解决 方案 都 需要 使 用 广播 信息 。 此 外 ， 证 多 个 点 
的 信息 保持 一 致 也 是 很 困难 的 。 一 些 点 由 于 网 络 延 迟 ， 收 到 的 数据 更 新 或 软件 更 新 的 信息 可 
能 比 其 他 点 晚 。 由 于 信息 不 完整 ， 优 化 解决 就 不 可 能 。 而 且 ， 分 布 式 解决 方案 通常 要 求 各 种 
成 员 之 间 协 作 。 


1.2.5 网 络 与 分 布 式 操作 系统 


区 别 网 络 操 作 系 统 和 分 布 式 操作 系统 的 主要 因素 是 它们 的 透明 度 和 对 成 员 系 统 的 要 求 。 

系统 要 求 

分 布 式 系统 要 求 所 有 成 员 都 分 别 运 行 它们 自己 拥有 的 同一 分 布 式 操作 系统 的 拷贝 ， 但 分 
布 式 操 作 系 统 也 常 在 本 地 另 一 种 不 同 的 底层 操作 系统 或 集中 式 操作 系统 之 上 运行 。 运 行 于 一 
个 底层 操作 系统 之 上 的 分 布 式 操作 系统 常 称 为 中 间 件 (midware)。 网 络 操作 系统 不 要 求 成 员 
运行 同样 的 系统 ， 只 要 求 它们 在 拷 员 文件 和 远程 登录 之 类 操作 上 使 用 同样 的 协议 。 因 此 网 络 
操作 系统 和 分 布 式 操作 系统 之 间 的 最 大 区 别 ， 就 是 网 络 操作 系统 不 隐藏 在 不 同系 统 上 操作 这 
一 事实 。 也 就 是 说 ， 它 并 不 将 远程 操作 对 用 户 透 明 ， 也 不 支持 如 下 任何 一 种 透明 性 。 

透明 性 

我 们 现在 解释 分 布 式 操作 系统 支持 的 各 种 透明 性 ， 其 中 一 些 透 明 性 比 另 一 些 透 明 性 是 我 
们 更 希望 获得 的 。 

4 名 字 透 明 性 : 资源 的 名 字 并 不 能 表明 文件 、 数 据 或 进程 在 分 布 式 系统 中 的 物理 位 置 。 

如 果 用 户 改 变 位置 ， 他 们 看 到 的 系统 视图 也 不 会 改变 ， 因 为 名 字 跟 实际 位 置 没有 关 

联 。 总 之 ， 这 意味 着 某 种 全 局 命名 方案 。 

4 位 置 透 明 性 : 当 提供 位 置 透明 性 时 ， 用 户 不 知道 他 们 所 使 用 的 资源 的 实际 物理 位 置 。 

这 意味 着 支持 名 字 透 明 性 和 访问 透明 性 ， 在 涉及 文件 和 处 理 器 时 是 有 用 的 ， 利 用 它们 

时 没有 附加 成 本 。 但 是 对 于 打印 机 这 类 资源 ， 通 常 不 希望 有 位 置 透明 性 。 当 用 户 打 印 
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一 个 文档 时 ， 需 要 知道 它 将 在 哪儿 打印 出 来 。 

4 访问 透 阴性 : 访问 透明 性 比 位 置 透明 性 更 进一步 ， 用 户 不 能 区 分 本 地 资源 和 远程 资 
源 。 在 界面 、 命 令 和 时 间 (最 困难 的 方面 ) 上 ， 对 资源 的 本 地 访问 和 远程 访问 是 完全 
一 样 的 。 由 于 时 间 的 约束 ， 这 通常 只 能 在 本 地 〈 在 同一 个 局 域 网 中 ) 分 布 式 系统 上 获 
得 。 访问 透明 性 最 困难 的 方面 之 一 是 支持 安全 访问 ， 而 不 受 访问 透明 性 的 妨碍 ， 如 第 
11 章 中 所 述 。 

4 迁移 透明 性 : 迁移 透明 性 意味 着 用 户 不 能 觉察 到 一 个 资源 或 他 们 的 工作 是 否 被 迁移 到 
分 布 式 系统 中 的 另 一 个 位 置 。 要 实现 这 一 点 ， 名 字 透 明 性 是 必要 的 前 提 。 这 个 问题 将 
在 第 4 章 和 第 7 章 详细 讨论 。 

4 复制 透明 性 : 复制 透明 性 允许 在 整个 系统 中 存在 文件 和 服务 器 的 多 份 拷贝 。 而 且 这 些 
拷贝 对 用 户 透明 ， 并 且 所 有 的 修改 和 更 新 对 多 个 拷贝 一 致 。 关 于 复制 透明 性 的 更 多 知 
识 请 参见 第 8 章 和 第 9 章 。 

4 并 发 和 并 行 透 明 性 : 多 个 进程 可 以 利用 同一 个 资源 ， 或 者 一 个 进程 可 以 同时 利用 多 个 
资源 ， 而 不 会 冲突 或 知晓 。 这 些 任务 被 自动 和 高 效 处 理 以 充分 利用 分 布 式 系统 。 这 方 
面 的 内 容 将 在 第 10 Hitt. 

4 故障 透明 性 : 如 果 分 布 式 系统 中 的 一 条 链 路 或 系统 发 生 故 障 ， 整 个 系统 不 会 停止 运 
行 。 故 障 透明 性 是 分 布 式 计算 相对 于 集中 式 计算 的 重要 优势 ， 后 者 只 能 任 由 你 的 一 
台 ， 也 是 惟一 的 一 全 计算 机 崩溃 而 毫 无 办 法 。 这 个 问题 将 在 第 9 章 详细 讨论 。 


1.3 什么 是 实时 系统 


实时 系统 必须 满足 有 限 响 应 时 间 的 限制 ， 否 则 将 承受 严重 后 果 。 如 果 这 个 后 果 是 性 能 的 
降低 而 不 是 故障 ， 则 系统 被 称 为 软 实时 系统 。 如 果 后 果 是 系统 故障 ， 则 这 个 系统 被 称 为 硬 实 
时 系统 。 在 硬 实时 系统 中 ， 系 统 故障 可 能 导致 死亡 或 其 他 威胁 生命 的 后 果 。 如 果 能 容忍 小 概 
率 的 系统 故 摩 ， 则 这 种 系统 被 称 为 稳固 实时 系统 。 通 过 网 络 实现 的 多 媒体 应 用 就 是 稳固 实时 
系统 的 例子 。 你 可 能 已 经 听 说 大 多 数 计算 机 系统 都 必须 满足 某 些 时 间 限 制 ， 否 则 将 承受 后 
果 ， 事 实 的 确 如 此 。 大 多 数 系统 是 软 实 时 系统 。 在 本 书 中 谈 到 实时 系统 时 我 们 通常 指 硬 实时 
系统 和 稳固 实时 系统 ， 它 们 可 能 引起 严重 的 后 果 。 实 时 计算 的 典型 教学 工具 是 用 计算 机 控制 
火车 ， 如 果 程 序 失 败 则 列车 倾覆 。 如 果 这 不 是 练习 的 话 ， 将 有 人 员 伤 亡 。 这 是 一 个 我 们 都 希 
望 尽 量 做 得 完美 的 领域 。 传 统 的 实时 大 量 用 在 电信 、 航 空 和 国防 工业 领域 。 

有 两 类 实时 系统 ， 反 应 式 和 髓 入 式 。 反 应 式 实时 系统 包含 一 个 与 环境 不 断交 互 的 系统 。 
这 个 交互 可 能 是 领航 员 不 断 按 控 制 键 ， 或 一 个 人 不 断 按 键 或 按钮 。 艇 人 式 系统 是 用 以 控制 一 
个 安装 在 更 大 系统 中 的 特定 硬件 。 现 实 中 的 例子 就 是 汽车 中 控制 油气 混合 的 微 处 理 器 。 

关于 实时 系统 的 更 多 知识 将 在 下 面 两 小 节 中 讲解 。 实 时 事件 特点 将 在 1.3.1 节 中 讨论 ， 
影响 分 布 式 实时 系统 的 网 络 特点 将 在 1.3.2 节 中 说 明 。 


1.3.1 实时 事件 的 特点 


实时 事件 有 如 下 三 类 : 异步 的 、 同 步 的 和 等 时 的 。 异 步 事 件 是 完全 不 可 预测 的 ， 比 如 暴 
风雨 中 闪电 将 击 中 的 确切 位 置 。 一 般 来 说 ， 异 步 事 件 是 由 外 部 原因 引起 的 。 例 如 电话 呼叫 是 
异步 的 ， 电 信 程 序 不 知道 用 户 什 么 时 候 会 用 电话 与 系统 连接 。 相 反 ， 同 步 事 件 是 可 以 预测 
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的 ， 如 果 它 要 出 现 的 话 ， 会 按 精确 的 规则 出 现 。 同 步 事件 通常 是 由 内 部 原因 引起 的 ， 比 如 艇 
人 式 部 件 。 如 果 事 件 有 任何 类 型 的 传播 延迟 ， 例 如 网 络 连 接 ， 则 该 事件 不 是 同步 的 。 如 果 事 
件 严格 出 现在 一 个 给 定 的 时 间 范 围 内 ， 它 可 以 被 称 为 等 时 的 (isochronous， 读 做 eye-sock-run- 
us)。 但 这 一 类 在 技术 上 作为 异步 事件 的 一 个 子 类 ， 并 不 总 被 应 用 所 适应 。 等 时 事件 的 一 个 
例子 是 在 分 布 式 多 媒体 应 用 中 接收 音频 字 节 。 音 频 字 节 必须 在 这 个 应 用 正常 工作 所 可 能 接受 
的 时 间 范 围 内 接收 到 。 可 以 预期 这 些 字 节 流 不 会 正好 在 预定 的 时 刻 接 收 到 ， 因 为 可 能 由 于 网 
络 错误 而 遇 到 网 络 延迟 。 

值得 指出 的 是 这 些 术语 在 网 络 科 学 范围 内 也 有 意义 。 具 体 来 说 ， 蜡 步 描述 了 一 个 以 非 连 
续 方 式 独立 传输 每 个 数据 包 的 网 络 或 网 络 协议 。 但 是 ， 同 步 网 络 或 网 络 协议 则 是 把 一 条 消息 
作为 一 个 连续 的 位 流 发 送 。 


1.3.2 影响 分 布 式 实时 应 用 的 网 络 特性 


下 面 是 底层 网 络 中 能 影响 分 布 式 实时 应 用 的 四 个 因素 。 

1. 网 络 响应 时 间 。 

2. 带宽 /成 本 。 

3. 路 由 优化 。 

4. 微 网 络 特性 。 

第 一 个 因素 是 基本 网 络 响应 时 间 不 能 忽略 。 响 应 时 间 是 由 于 数据 从 源 地 传播 到 目的 地 所 
产生 的 延迟 。 在 集中 式 系统 ， 系 统 内 通信 的 吃 应 时 间 是 可 以 忽略 不 计 的 。 但 由 于 基本 的 物理 
限制 ， 分 布 式 系统 的 响应 时 间 则 成 问题 ， 尤 其 是 对 电信 这 样 的 分 布 式 实 时 系统 。 例 如 ， 即 使 
以 光 的 速度 传播 ， 信 息 横 越美 国 大 陆 也 要 20ms。 用 高 速 公 路 作 类 比 ， 这 就 是 假定 没有 红 灯 
(在 各 个 节点 没有 延迟 ) 、 拥 塞 或 交通 事故 (数据 错误 引起 重 传 )。 如 果 应 用 要 求 在 远 远 散 布 
在 各 地 的 几 个 部 分 之 间 大 量 通 信 ， 可 能 无 法 达到 实时 的 要 求 。 而 且 ， 网 络 延 迟 使 得 所 有 分 布 
式 事件 成 为 异步 的 (或 者 等 时 的 )， 精 确 预测 时 间 就 不 可 能 了 。 

第 二 个 因素 是 带宽 /成 本 的 权衡 。 分 布 式 实时 应 用 要 求 国定 带宽 。 当 前 一 条 在 东京 与 大 
阪 之 间 的 155Mbps 的 连接 (比如 一 个 0C3 连接 ) 每 个 月 要 花费 约 五 十 万 美元 。 因 此 在 技术 上 
也 许 能 实现 播送 实时 视频 ， 但 却 不 经 济 。 好 在 带宽 每 年 都 在 不 断 降价 ， 虽然 目前 还 不 能 确定 
海量 带宽 何 时 普及 到 大 众 并 真正 结束 “全 球 等 待 ” (world wide wait, www) 的 时 代 。 历 史 已 
经 一 再 向 人 们 显示 ， 不 管 有 多 少 资源 可 用 〈 不 管 资 源 是 计算 机 物理 资源 还 是 金钱 )， 我 们 总 
是 能 找到 办 法 来 消耗 这 些 资 源 ， 并 且 梦 想 有 更 多 资源 。 现 在 很 难 想 早期 只 有 16K FHA 
的 卫星 如 何 工 作 ， 以 及 300 波 特 家 用 调制 解 调 器 曾经 如 何 值得 炫 焰 (不 是 炫 次 它 在 计算 机 博 
物 馆 内 的 价值 )。 

第 三 个 因素 是 分 布 式 实时 系统 必须 驻 留 在 网 络 中 ， 因 此 受制 于 网 络 的 拓扑 结构 和 网 络 对 
分 布 和 路 由 的 影响 。 理 论 上 说 ， 网 络 设计 要 使 源 地 到 目的 地 之 间 经 过 的 节点 数 最 少 ， 但 这 个 
理论 在 实践 中 并 不 现实 〈 参 见习 题 1.8)。 打 个 比方 ， 设 想 你 在 交通 繁忙 时 刻 从 市 中 心 驾车 
前 往 郊 区 ,地理 上 最 短 的 路 径 其实 并 不 就 是 花费 时 间 最 短 的 路 径 (也 就 是 最 快 的 路 径 )。 地 
理 最 短 的 路 径 可 能 由 于 种 种 原因 而 速度 很 慢 ， 包 括 速 度 限制 或 者 说 路 径 的 数据 传输 速率 、 路 
径 上 的 流量 、 通 路 数 或 者 说 路 径 的 容量 。 如 果 该 城市 有 收费 公路 ， 最 短 的 路 径 可 能 不 是 最 便 
宜 的 路 径 。 所 有 这 些 问 题 在 信息 高 速 公路 上 也 存在 ， 因 此 分 布 式 实 时 应 用 的 整体 性 能 总 的 来 
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说 受 当前 的 基础 设施 约束 。 
第 四 个 因素 是 分 布 式 实时 系统 受 微 网 络 特性 的 影响 ， 比 如 网 络 交换 机 的 缓存 大 小 、 队 列 
大 小 ， 以 及 网 络 所 允许 通过 的 包 大 小 。 理 论 上 ， 这 些 特性 应 该 对 上 层 和 应 用 透明 ， 但 实际 上 8] 
由 于 编写 软件 时 程序 员 的 技术 水 平 限制 和 缺少 支持 标准 ， 因 此 常 出 现 问题 。 我 的 一 个 同事 曾 
遇 到 过 一 个 未 能 充分 利用 高 速 WAN 而 且 是 不 能 用 的 视频 流程 序 (匿名 的 ) ， 是 由 于 视频 程 
序 员 编写 了 65K 字 节 大 小 的 UDP 包 。 这 说 明了 应 用 受 限 于 微 网 络 特 人 性， 应 用 的 这 些 方 面 应 
由 更 低级 软件 支配 。 没 人 知道 一 个 软件 会 使 用 多 少年 (如 1999 年 9 月 9 日 S 和 2000 年 软件 
危机 )， 以 及 哪 一 类 技术 将 使 用 它 〈( 比 如 视频 流程 序 )。 代 码 越 灵活 ， 应 用 的 可 用 性 就 越 强 。 


1.4 什么 是 并 行 系统 


像 分 布 式 系统 一 样 ， 漠 行 系统 包含 多 个 处 理 器 。 但 是 这 多 个 处 理 器 (通常 是 同 构 的 ， 
并 且 位 于 同一 台 计 算 机 中 。 除 了 多 个 处 理 器 和 外， 并行 计算 机 可 以 设计 成 每 个 处 理 器 都 有 自己 
的 本 地 内 存 。 因 此 并 行 计算 机 也 称 为 多 计算 机 《multicomputer)。 如 果 并 行 的 处 理 器 共享 内 
存 ， 它 们 就 叫做 多 处 理 器 (multiprocessor)。 这 些 多 处 理 器 常 按 访问 共享 内 存 的 开销 来 分 类 。 
如 果 所 有 处 理 器 的 访问 时 间 一 样 ， 则 多 处 理 器 的 内 存 称 为 一 致 内 存 访问 (Uniform Memory Ac- 
cess，UMA) ， 和 否则 称 为 非 一 致 内 存 访问 (Non-Uniform Memory Access，NUMA)。 不 共享 内 存 的 
多 处 理 器 (每 个 处 理 器 有 自己 的 本 地 内 存 ) 也 叫做 非 远程 内 存 访问 (NO Remote Memeory Ac- 
cess, NORMA) 多 处 理 器 。1.4,1 节 讲 述 一 些 体系 结构 ， 用 于 将 众多 处 理 器 组 织 成 单 台 计算 
机 。1.4.2 节 讲 述 并 行 计算 环境 中 所 使 用 的 一 些 软 件 范例 。 由 于 并 行 计 算 机 通常 用 来 解决 最 
复杂 的 问题 ， 并 且 远 比 单 处 理 器 计算 机 昂贵 ， 因 此 也 常 称 之 为 超级 计算 机 。 并 行 操作 系统 的 
任务 就 是 有 效 利 用 所 有 资源 来 解决 那些 复杂 问题 ， 以 及 提高 计算 速度 。 


1.4.1 并 行 体系 结构 


我 们 现在 讲述 一 些 常见 的 并 行 体系 结构 。 详 细 说 明 1.3 描述 了 一 个 引 自 [Fly72] 的 流行 
体系 结构 分 类 法 。 用 来 连接 各 个 处 理 器 的 互联 网 络 大 致 决定 一 个 并 行 系统 的 体系 结构 。 如 果 
并 行 系统 是 一 个 多 处 理 器 ， 互 联网 络 也 用 来 连接 处 理 器 和 共享 内 存 模 块 ， 如 图 1-8 所 示 。 互 
i eo ed ce Lig ] 





图 1-8 多 处 理 器 中 的 互联 网 络 





O 1999 年 9 月 9 日 会 表示 成 9999， 这 个 数字 被 一 些 程序 员 在 一 些 应 用 中 作为 例外 处 理 ， 从 而 当时 钟 走 到 此 日 期 时 
将 造成 混淆 ， 除 非 能 预知 此 问题 。 幸 好 ， 在 许多 地 方 这 个 问题 都 将 在 千年 虫 测试 过 程 中 被 辨认 出 来 。 
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详细 说 明 1.3 
Flynn 的 体系 结构 分 类 











Flynn 根据 如 何 处 理 : 机 器 指令 和 数据 来 分 类 各 种 体系 结构 。 有 如 下 四 类 [Fly72]。 

SISD 

第 一 类 体系 结构 是 单 指令 流 单数 据 流 (SISD)。 这 样 的 计算 机 遵循 传统 的 冯 , 诺 依 曼 模 
型 ， 其 例子 包括 传统 的 单 处 理 器 计算 机 ， 比 如 简单 的 PC 机 或 20 世纪 80 年 代 早期 的 主机 。 

SIMD 

第 二 类 体系 结构 是 单 指令 流 多 数据 流 (SIMD)。 这 类 体系 结构 适合 于 对 大 批 数 据 执 行 
同样 的 指令 。 例 如 对 一 个 矩阵 的 第 i 行 数据 乘 以 一 个 值 ve 这 里 单个 指令 是 条， 但 作用 于 
该 行 的 每 个 元 素 。 有 一 种 并 行 体系 结构 模型 叫做 向 量 - 数组 处 理 器 ， 比 如 CRAY 超级 计 
算 机 就 是 SIMD 体系 结构 。 向 量 机 将 多 个 (典型 为 几 千 个 ) RASA RMA. ME 
-数组 处 理 器 擅长 计算 的 教 据 类 型 是 向 量 。 其 他 SIMD 例子 还 包括 Hliac IV 和 连接 机 CM- 
2。 REKA SMD 体系 结构 的 并 行 系统 发 展 速度 快 于 操作 系统 技术 ， 因 此 SIMD 系统 通常 
利用 ~ 个 使 用 传统 单 处 理 器 操作 系统 的 前 端 计算 机 来 控制 。 这 样 SMD 计算 机 就 被 当 作 
“前 端 ”计算 机 的 一 个 设备 了 了 。 

MISD = So 

第 三 类 体系 结构 是 多 指令 流 单数 据 流 (MSD), Flynn 为 了 完整 性 而 列 入 了 这 个 类 ， 
但 目前 没有 这 一 类 系统 。 

MIMD | 

最 后 是 多 指令 流 和 多 数据 流体 系 结构 (MIMD), PARA FIAT ART IAA MIMD 体 
系 结构 ， 但 本 节 我 们 只 讨论 并 行 机 。MIMD 体系 结构 利用 多 个 处 理 器 取得 数据 和 指令 ， 然 
ERDHA. MIMD 的 例子 包括 Seguent, 2.7% HbA da A BL, 








制 。 有 些 互联 网 络 支 持 分布 式 路 由 控制 ， 另 一 些 使 用 集中 式 路 由 控制 。 此 外 ， 互 联网 络 的 基 
本 拓扑 可 以 是 静态 或 动态 的 。 动 态 拓扑 允许 互联 网 络 在 运行 期 间 重 新 配置 ， 通 过 使 用 交换 机 
来 实现 各 种 连接 。 当 一 个 互联 网 络 能 实现 每 一 个 可 能 的 连接 时 ， 它 就 被 称 为 拥有 100% 的 置 
换 能 力 。 现 在 我 们 来 看 看 互联 网 络 的 各 种 拓扑 。 

总 线 

最 简单 的 互联 网 络 是 总 线 。 
总 线 是 静态 的 ， 并 且 不 要 求 任何 
类 型 的 路 由 。 每 个 处 理 器 和 内 存 
模块 都 连接 到 总 线 上 ， 数 据 的 所 
有 事务 和 移动 都 发 生 在 这 个 共享 
的 总 线 上 ， 如 图 1-9 所 去 。Se- 
quent 并 行 计算 机 用 一 条 总 线 作 
为 互联 网 络 。 虽 然 这 是 一 个 比较 
简单 的 互联 网 络 拓扑 ， 但 总 线 限 
制 了 模块 间 的 带宽 ， 从 而 产生 了 图 1-9 用 做 互联 网 络 的 总 线 


总 线 
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通信 瓶颈 。 

交叉 互联 网 络 

允许 动态 配置 的 最 简单 互联 网 络 是 交叉 网 络 。 交 
叉 网 络 是 连接 n 个 内 存 模 决 和 n 个 处 理 器 的 nxn 连 
接 。 这 样 的 网 络 要 求 0 (n) 个 开关 ， 如 图 1-10 所 示 。 
这 么 大 量 的 开关 意味 着 它 是 一 个 昂贵 的 互联 网 络 。 这 个 
动态 配置 具有 100% 的 置换 能 力 ， 并 且 多 个 处 理 器 可 以 
同时 使 用 网 络 ， 只 要 没有 使 用 同一 个 交叉 开关 。 

超 立方 体 

一 个 著名 的 静态 互联 网 络 是 超 立 方 体 。 超 立方 体 
是 按 其 维 数 定义 的 。 具 体 来 说 ，k - 立方 体 是 一 个 有 > 
个 开关 的 网 络 。 由 于 开关 数目 是 2 的 指数 ， 因 此 这 些 立 
方 体 有 时 候 也 称 为 二 进 制 超 立 方 体 。 开 关 编 号 为 0 到 > 
-1， 如 图 1-11 所 示 。 网 络 中 的 两 个 开关 当 且 仅 当 它 们 
的 二 进 制 编号 只 有 一 个 位 不 同时 有 连接 。 因 此 开关 0100 
跟 开 关 0110 之 间 有 连接 ， 但 开关 0100 跟 开关 0111 之 间 
没有 连接 。 这 种 拓扑 的 优点 是 两 个 开关 之 间 的 距离 容易 
计算 。 在 这 种 拓扑 中 ， 单 个 处 理 单元 位 于 每 个 开关 中 。 

洗 牌 交换 互联 网 络 

最 具 动 态 性 的 互联 网 阁 之 一 是 洗 牌 交换 网 络 。 网 
络 中 开关 人 允许 动态 重 配置 ， 并 有 四 种 操作 方式 ， 如 图 
1-12 所 示 。 其 中 控制 位 决定 了 开关 盒 的 操作 方式 。 这 
类 互联 网 络 的 取 名 源 自 其 行为 方式 很 像 重 新 洗 牌 。 具 
体 来 说 ， 理 想 的 洗 牌 是 实现 高 位 目的 地 与 低位 目的 地 
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X= 开关 
P = 处 理 器 
M= 内 存 模块 


图 1-10 交叉 互联 网 络 





图 1-11 3 次 超 立 方 体 的 互联 网 络 


完全 交叉 访问 ， 如 图 1-13 所 示 。 多 级 洗 牌 交换 互联 网 


=- s 


直接 通过 交换 
高 位 广播 低位 广播 


图 1-12 洗 牌 交换 互联 网 络 中 的 2x 2 开关 盒 





图 1-13 理想 的 洗 牌 
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络 则 如 图 1-14 所 示 。 在 这 个 例子 中 使 用 了 八 个 输入 。 由 于 任何 产地 都 能 根据 其 地 址 定位 目 
的 地 ， 因 此 在 这 个 网 络 中 寻 址 是 很 简单 的 。 具 体 来 说 ， 最 高 位 的 二 进 制 位 决定 在 网 络 第 一 级 
的 动作 ， 第 二 高 位 决定 第 二 级 ， 依 此 类 推 。 二 进 制 位 1 表示 通过 底部 输出 ， 而 二 进 制 为 0 则 
要 求 通过 顶端 输入 。 其 他 基于 洗 牌 交换 网 络 的 互联 网 络 包括 Benes, Banyan, Omega 和 Theta 
互联 网 络 。 





图 1-14 多 级 洗 牌 交换 互联 网 络 


1.4.2 并 行 软件 范例 


并 行 系统 在 其 多 个 处 理 器 间 分 配 任务 有 三 类 基本 方式 。 分 配 工作 可 由 程序 员 或 系统 来 实 
现 ， 也 可 能 由 其 体系 结构 决定 。 

1. 复制 代码 ， 分 钊 数据 。 在 这 种 情形 下 ， 每 个 处 理 器 被 分 配 相同 的 任务 ,各自 处 理 一 
批 不 同 的 数据 。 例 如 每 个 处 理 器 得 到 一 个 分 类 程序 ， 但 其 中 一 个 处 理 器 要 按 标题 和 日 期 来 分 
类 所 有 IEEE 期 刊 ， 而 另 -- 个 处 理 器 要 按 标题 和 日 期 分 类 所 有 ACM 期 刊 。 

2. 流水 线 。 在 这 种 情形 下 ， 每 个 服务 器 分 配 的 工作 依赖 于 前 一 个 处 理 器 完成 的 任务 ， 
很 像 一 条 流水 线 。 整 个 任务 要 到 最 后 一 个 处 理 器 完成 其 工作 时 才 最 终 完 成 。 这 个 方法 是 仿照 
享 利 "福特 汽车 制造 生产 线 的 思路 。 整 个 工作 分 成 不 同 的 处 理 阶段 ， 每 个 处 理 器 分 别 负责 完 
成 一 个 阶段 ， 并 送 往 下 一 个 处 理 器 。 

3. 树 状 结构 。 这 种 情形 类 似 于 写 算法 时 的 自 顶 向 下 设计 方法 。 第 一 个 处 理 器 有 一 个 任 
务 要 完成 ， 而 这 个 任务 由 几 个 子 任务 组 成 。 然 后 将 这 些 子 任 务 分 给 其 他 处 理 器 去 做 ， 而 这 些 
处 理 器 又 进一步 将 这 些 子 任务 再 分 成 几 个子 任 务 交 给 别 的 处 理 器 去 做 ， 依 此 类 推 。 


1.5 分 布 式 应 用 实例 


分 布 式 系 统 不 但 包含 传统 的 集中 式 机 器 部 件 ， 而 且 也 有 实时 部 件 和 并 行 部 件 。 图 1-15 
描述 电信 应 用 领域 中 一 个 这 样 的 应 用 。 虽 然 这 里 没有 给 出 任何 公司 生产 中 的 任何 一 个 特定 的 
系统 架构 ， 但 是 给 出 了 在 这 样 一 个 系统 中 我 们 一 般 能 找到 什么 。 现 在 我 们 来 解释 每 个 部 件 。 
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图 1-15 分 布 式 系 统 的 例子 


图 中 用 户 代表 希望 访问 该 电信 系统 的 多 种 应 用 程序 用 户 。 当 用 户 拨 和 时， 他们 通过 电话 
交换 机 访问 电话 应 用 ， 交 换 机 是 根据 接收 到 的 他 们 在 话机 上 拨 出 的 号 码 决定 的 。 用 户 希 望 即 
时 和 连续 的 服务 ， 使 得 这 一 -分 布 式 系统 成 为 具有 严格 时 间 限 制 的 分 布 式 实时 系统 。 严 格 要 求 
系统 具有 实时 性 并 不 仅仅 是 为 了 让 顾客 满意 ， 还 考虑 到 电话 服务 还 连接 了 顾客 与 911 报警 、 
医生 办 公 室 、 毒 品 控制 中 心 ， 以 及 其 他 事 关 生命 安全 的 实时 性 场所 。 

电话 交换 机 能 同时 处 理 多 个 呼叫 ， 这 是 因为 它 是 一 个 包含 多 条 接 入 和 接 出 电话 线 的 并 
行 硬件 部 件 ， 对 多 个 同时 呼叫 是 同时 操作 处 理 的 。 交 换 机 要 求 每 年 停机 时 间 少 于 1 分钟 ， 因 
此 必须 具有 极 高 的 容错 性 ， 并 内 置 元 余部 件 。 交 换 机 是 一 个 典型 的 能 人 式 实时 部 件 的 例子 。 

电话 节点 是 带 有 电话 卡 的 计算 机 的 通用 术语 ， 比 如 能 使 计算 机 接收 传真 的 传真 卡 ， 或 者 
使 计算 机 能 处 理 电话 会 议 的 会 议 卡 。 电 话 节点 只 运行 于 基于 电信 的 应 用 。 在 商业 化 环境 中 ， 
可 能 有 一 组 电话 节点 运行 应 用 软件 。 这 些 电话 节 点 可 能 作为 电信 系统 的 一 个 分 布 式 子 系统 ， 
用 完全 分 布 式 的 方式 组 织 。 由 于 宛 余 或 容错 性 能 ， 这 种 部 件 也 常 作为 并 行 部 件 ， 因 为 电信 应 
用 不 允许 停机 (用 户 也 不 能 允许 !)。1.4.2 节 中 描述 的 每 个 软件 范例 都 可 用 于 这 个 部 件 。 电 
话 节 点 最 不 常见 的 用 途 是 复制 代码 和 分 割 数据 ， 因 为 这 样 就 要 求 每 个 电话 节点 都 拥有 所 有 硬 
件 卡 的 复 本 ， 从 而 极 大 地 增加 了 系统 的 硬件 成 本 。 

电话 节点 部 件 一 般 用 必 语 音 应 管 单元 (voice response unit, VRU), 或 者 与 VRU XE., 
VRU 根据 用 户 电话 拨号 情况 向 用 户 播放 预先 录制 的 信息 。 一 个 预 录 信 息 的 例子 是 “对 不 起 ， 
电话 不 通 ， 请 挂机 并 重 拨 。” VRU 也 常 提供 交互 式 语音 应 管 (interactive voice response, IVR) 
能 力 ， 比 如 上 面 那个 例子 后 面 可 以 再 加 一 句 “ 如 果 您 需要 帮助 ， 请 按 “0"。” 当 用 户 输入 0 
时 ， 将 转 接 给 服务 人 员 。 这 里 IVR 就 是 一 个 交互 式 实时 部 件 的 例子 。 

计 费 部 件 是 一 个 实时 应 用 ， 根 据 用 户 的 活动 来 计算 相应 的 费用 。 某 些 情况 下 ， 计 费 部 件 
还 要 不 断 检查 用 户 花费 了 多 少 ， 并 与 其 许可 的 额度 比较 。 例 如 ， 如 果 用 的 是 预付 费 电 话 卡 ， 
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应 用 程序 要 确保 用 户 使 用 的 金额 不 超过 卡 里 的 数值 。 这 里 就 需要 与 数据 库 部 件 交 互 。 如 果 这 
个 部 件 不 精确 ， 电 信 公 司 就 要 蒙受 损失 。 

数据 库 部 件 可 与 应 用 的 许多 方面 相关 。 通 常 电信 公司 为 大 量 用 户 服务 ， 因 此 要 求 数据 库 
完全 分 布 以 分 散 负荷 ， 减 少 用 户 的 等 待 时 间 。 而 且 数 据 库 部 件 内 的 子 部 件 可 能 是 并 行 结构 ， 
以 加 快速 度 。 这 个 部 件 必须 处 理 本 书 几 章 中 讨论 到 的 问题 ， 包 括 第 4 章 提 到 的 分 布 式 内 存 ， 
第 5 章 提 到 的 并 发 控制 ， 第 8 章 提 到 的 分 布 式 文件 ， 以 及 第 9 章 提 到 的 事务 管理 。 

虽然 还 有 许多 细节 需要 讲解 ， 但 显然 即使 从 简单 角度 来 看 电信 和 应用， 它 也 要 求 有 各 种 系 
统 类 型 的 部 件 ， 包 括 实 时 的 和 并 行 的 。 电 信 业 只 是 复杂 分 布 式 应 用 最 典型 的 应 用 领域 之 一 ， 
其 实 计算 机 行业 的 每 个 方面 都 存在 这 种 系统 ， 并 且 还 在 不 断 创建 。 


1.6 小 结 


分 布 式 系统 是 计算 机 行业 和 日 常生 活 中 不 断 增长 的 应 用 领域 , 通常 包括 实时 和 并 行 部 
件 。 每 个 部 件 都 向 操作 系统 提出 各 自 的 一 些 待 处 理 的 问题 。 并 行 和 分 布 式 系统 都 有 多 个 处 理 
人 器。 并行 系 统 包含 紧 看 合同 构 部 件 ， 而 通常 的 分 布 式 系 统 拥有 大 量 不 同 的 部 件 。 网 络 系统 并 
不 试图 隐藏 使 用 多 个 远程 资源 的 事实 。 因 此 ， 昌 然 分 布 式 系统 可 能 使 用 远程 处 理 器 而 不 被 用 
户 发 觉 ， 而 网 络 操作 系统 的 用 户 则 必须 输入 所 有 的 远程 指令 。 实 时 系统 本 身 就 具有 严格 的 时 
间 限 制 。 尤 其 这 些 限制 本 身 具有 挑战 性 ， 在 处 理 分 布 式 实时 系统 的 网 络 延 迟 时 更 加 如 此 。 

在 本 书 中 ,分 布 式 计算 的 基本 内 容 在 第 一 部 分 中 讲述 。 第 一 部 分 包含 一 些 在 人 门 课程 中 
偶然 提 及 但 对 学 习 分 布 式 系统 很 重要 的 材料 。 第 二 部 分 的 材料 建立 在 第 一 部 分 的 题材 之 上 ， 
是 对 这 些 基 本 问题 的 扩展 ， 主 要 集中 在 分 布 式 系统 中 更 深入 、 更 高 级 、 更 难 理解 的 问题 细 
P. 第 12 章 中 的 Windows 2000 实例 对 研究 单个 系统 如 何 解决 分 布 式 操作 系统 中 的 许多 问题 
进行 了 全 面 的 考察 。 通 过 这 些 学 习 ， 希 望 能 令 读 者 举一反三 ， 踏 人 分 布 式 计算 的 世界 ， 创 建 
并 看 到 一 个 浑然 一 体 的 系统 ， 尽 管 它 是 由 单独 的 、 不 同 的 部 件 组 成 。 


1.7 参考 文献 


下 列 参 考 文献 包含 关于 分 布 式 、 实 时 和 并 行 系统 以 及 网 络 和 并 行 计算 机 的 更 多 资料 : 
[Akl97, Ber92, Bla96, DDK94, Hal96, Hun95, Kop97, Kri89, Lap92, Sin97, SSF97, Sta97, 
Ste94, Tan95 和 Tan96j。 与 本 章 内 容 有 关 的 一 些 传 统 研究 论文 包括 [BCEF94，Brjo94 (论文 
集 )，CaMu94 (论文 集 ) Mul93a 〈 论 文集 ) ，SHFECB93 和 Son95 (论文 集 ) ]。 

现在 我 们 列 出 有 关 高 级 操作 系统 的 一 些 neme 上 的 主要 站 点 ， 其 中 讨论 的 题材 对 本 章 
和 全 书 的 学 习 有 益 。IEEE 计算 机 协会 实时 系统 技术 委员 会 的 主页 拥有 与 实时 技术 有 关 的 大 
量 链接 列表 ， 其 地 址 为 http; /Wes-www,bu.edu/pubyieee-r/Home.html。 关 于 超大 规模 集成 电路 
(VLSI) 和 并 行 体系 结核 方面 论文 的 一 组 链接 可 在 http: //rtlab. kaist.ac.kr: 80/ ~ yunju/wave- 
let-papers. html 上 找到 。Intemet 并 行 计 算 文 档 可 在 http: //www. hensa. ac. uk/parallel/ E $8 #1 . 
宾夕法尼亚 大 学 分 布 式 系统 技术 文档 和 研究 资料 库 包含 大 量 研究 论文 ， 可 在 http: /ww- 
w.cis.upenn.edu/ ~ dsl/library. html 上 找到 。 一 批 计 算 机 科学 书目 ， 可 在 http: //iinw- 
ww. ira. uka. de/bibliography/index. html 上 找到 ， 其 中 操作 系统 有 13 000 条 ， 并 行 处 理 有 32 000 
条 ， 分 布 式 计算 有 28 000 条 ， 还 有 超过 22 000 个 技术 报告 链接 。 网 络 CS 技术 报告 库 提供 全 
球 各 大 学 和 实验 室 关于 计算 机 科学 丰富 的 技术 报告 ， 地 址 为 htp: /www,ncstrl.org。WWW HE 
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拟 图 书馆 的 计算 类 目 也 很 有 帮助 ， 地 址 为 http: //sre. doc. ic. ac. uk/bySubject/Computing/over- 
view,html， 相 关 缩 略 词 的 虚拟 实体 (Virtual Entity of Relevant Acronyms, VERA) 位 于 http: // 
userpage. fu-berlin. de/ ~ oheiabbd/veramain-e.cgio IEEE 的 总 主页 在 http: //www. computer. org, 
计算 机 械 协会 《ACM) 的 主页 hup: //www.acm. omg/ 对 其 发 行 的 相关 资料 提供 了 很 有 用 的 搜索 
引擎 ， 甚 至 包括 一 些 摘要 。 计 算 机 在 线 研究 知识 库 (CORR) 地 址 为 http: //www.acm. org/ 
corr/。 操 作 系 统 专题 组 (SIGDPS) 的 学 报 可 在 AM 的 数字 图 书馆 里 找到 ， 其 地 址 为 http: // 


www. acm. org/pubs/contents/proceedings/ops/o 


习题 


= = = =e e e 
UAW Rw we 


为 什么 今天 的 计算 机 科学 家 必须 懂得 高 级 操作 系统 的 原理 ? 

网 络 操作 系统 和 分 布 式 操作 系统 之 间 的 主要 不 同 之 处 是 什么 ? 

哪些 局 域 网 和 广域网 协议 更 适合 实时 应 用 ? 

为 什么 无 线 局 域 网 会 普及 ? 

为 什么 说 用 分 布 式 操作 系统 来 执行 ISO/OSI 对 等 的 各 层 是 有 利 的 ? 

对 等 分 布 式 计算 模型 比 C/S 模型 好 在 哪里 ? 

本 章 讲 述 了 七 个 分 布 透明 性 。 请 对 每 一 种 透明 性 提出 并 描述 一 个 应 用 ， 说 明 在 分 
布 式 系统 中 这 种 透明 性 对 它 有 什么 好 处 ? 

Traceroute 是 一 个 工具 ， 显 示 网 络 中 从 源 点 到 目的 地 所 经 过 的 实际 路 由 。 在 你 的 本 
地 机 器 上 或 者 在 一 个 基于 Web 的 traceroute 网 关上 (如 雅虎 的 http: //ne- 
t. yahoo. com/cgi-bin/trace. sh)， 或 者 在 http: //www. tracert.com 的 多 重 traceroute, BK 
者 用 关键 字 traceroute 在 Internet 上 搜索 到 的 其 他 站 点 上 ， 运 行 traceroute。 在 每 天 三 
个 不 同 的 时 间 执 行 并 记录 从 你 所 在 大 学 (或 本 地 的 Intemet 节点 ) 到 选择 的 五 个 不 
同 目 的 地 之 间 的 路 由 跟踪 结果 ， 并 连续 进行 一 个 星期 。 注 意 每 次 应 该 跟踪 同一 批 
源 点 和 目的 地 。 

a. 每 次 得 到 的 结果 一 样 吗 ? 

b. 每 次 的 路 线 都 是 最 短 的 吗 ” 为 什么 ? 

c. 对 于 分 布 式 实 时 应 用 采取 优化 路 由 ， 这 意味 着 什么 ? 


1.9 为 如 下 各 种 系统 举 出 一 个 实例 。 


a. 软 实时 系统 。 

b. 稳固 实时 系统 。 
c. 硬 实时 系统 。 

d. 反应 式 实时 系统 。 
e. RAREH RG. 


1.10 为 下 面 各 种 事件 举 出 一 个 例子 〈 不 要 使 用 书 中 已 有 的 例子 ) 


a. 同步 事件 。 
b. 异步 事件 。 
c. 等 时 事件 。 


1.11 说 明 多 计算 机 和 党 处 理 器 之 间 的 不 同 。 
1.12 ”对 下 面 各 种 网 络 ， 列 出 它们 用 于 互联 的 并 行 体 系 结构 时 潜在 的 一 个 优 缺 点 。 
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a. 总 线 。 
b. 交叉 互联 网 络 。 
c. 超 立 方 体 。 
d. 洗 牌 交换 互联 网 络 。 
1.13 为 下 列 各 个 并 行 软件 范例 举 出 一 个 潜在 的 应 用 。 
a. 复制 代码 ， 分 割 数据 。 
b. 流水 线 。 
[29 | c. 树 状 结构 ， 
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操作 系统 中 影响 最 大 的 部 分 之 一 是 内 核 。 实 际 上 ， 内 核 是 计算 机 的 厨师 长 ， 确 保 所 有 的 
厨师 都 弄 不 坏 汤 ! 内 核 是 操作 系统 中 的 特权 部 分 ， 对 于 在 它 完 全 控制 之 下 的 所 有 系统 的 所 有 
资源 都 具有 完全 的 访问 特权 (分 布 式 系统 内 核 一 般 不 控制 每 个 成 员 ， 可 能 只 控制 本 地 系统 )， 
而 其 他 程序 就 没有 这 个 特权 。 内 核 控 制 进程 管理 ， 包 括 进程 迁移 (2.3 节 )、 进 程 调度 (2.4 
节 )、 内 存 管理 和 地 址 空间 (这 两 部 分 的 内 容 见 第 4 章 )。 这 些 功 能 在 一 个 被 保护 和 隔离 的 地 
址 空间 中 操作 ， 以 防止 被 其 他 应 用 程序 意外 或 恶意 地 冲突 和 操纵 。 我 们 从 2.1 节 讲 解 两 个 基 
本 内 核 类 型 开始 ，2.2 节 介 绍 与 进程 有 关 的 概念 ， 而 内 核 的 各 种 任务 和 解决 方法 则 在 2.3 和 
2.4 节 讨论 。 


2.1 内 核 类 型 


根据 内 核 大 小 及 所 包含 的 内 容 ， 内 核 设计 可 分 为 两 大 类 。 第 一 类 是 UNIX、05/360、 
VMS 所 用 的 单 片 集成 内 核 。 正 如 名 字 所 示 ， 单 内 核 系 统 拥 有 大 型 内 核 ， 包 含 大 多 数 的 操作 
系统 服务 ， 包 括 进程 、 内 存 、 文 件 、 命 名 和 设备 管理 ， 以 及 进程 间 通 信 。 换 句 话说 ， 单 内 核 
就 是 一 个 完整 的 操作 系统 。 第 4 章 和 第 $ 章 讨 论 的 系统 级 共享 内 存 或 基于 消息 的 通信 ， 也 常 
用 于 进程 间 通 信 以 实现 它们 的 功能 。 由 于 内 核 中 没有 保护 边界 ， 安 全 性 的 缺乏 ， 以 及 单 内 核 
的 尺寸 和 复杂 性 ， 使 得 调试 、 验 证 和 修改 都 很 困难 ， 因 而 招致 了 批评 。 单 内 核 不 仅仅 难以 调 
试 ， 而 且 根本 就 不 存在 调试 支持 。 在 分 布 式 环境 中 ， 不 是 每 个 拷贝 或 每 个 成 员 都 需要 系统 的 
所 有 功能 ， 这 就 使 得 硬件 与 内 核 的 接近 成 为 分 布 式 系统 中 的 问题 。 因 此 分 布 式 环境 更 倾向 于 
采用 第 二 种 内 核 类 型 一 一 分 层 内 核 。 

分 层 内 核 着 重 于 可 分 模块 的 设计 。 分 层 内 核 最 常见 的 一 类 是 微 内 核 ， 其 目的 是 使 内 核 
尽 可 能 的 小 。 分 布 式 实时 系统 一 般 使 用 微 内 核 。 实 际 上 ， 在 艇 人 式 实时 系统 中 微 内 核 就 是 整个 


=| = 加 -加 


人 eeann 应 用 接口 
Er | os waa] [esis 中 OS 服务 器 
a 系统 接口 


| 可 移 相机 机 独立 微 内 核 化 
机 器 独立 | 

| ann 

| 所 有 硬件 | 


图 2-1 微 内 核 设计 tole" 
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操作 系统 。 这 些 内 核 只 提供 最 少 的 服务 ， 比 如 进程 间 通 信和 有 限 的 设备 、 进 程 、 线 程 和 内 存 
管理 。 其 他 服务 是 在 内 核 之 上 实现 ， 作 为 用 户 空间 里 的 操作 系统 服务 。 这 些 服务 依赖 于 有 效 
的 进程 间 通 信 机 制 。 微 内 核 倾 向 于 使 用 模块 ， 从 而 易于 设计 、 实 现 、 安 装 、 扩 展 和 重 配置 。 
模块 设计 的 一 部 分 是 使 所 有 依赖 体系 的 部 分 位 于 同一 处 ， 如 图 2-1 所 示 。 这 有 助 于 提高 可 移 
植 性 。 这 也 使 微 内 核 吸引 分 布 式 操作 系统 ， 如 第 6 章 所 描述 的 Chorus (JavaOS 的 基础 技术 ) 
和 第 7 章 所 描述 的 Mach， 以 及 第 12 章 Windows2000 (基于 NT 技术 ) 实例 研究 中 描述 的 Win- 
dows NT, 


2.2 进程 和 线程 


执行 的 程序 常常 被 油 象 地 称 为 进程 。 从 系统 的 角度 来 看 ， 与 进程 具体 对 应 的 概念 就 是 工 
作 。 进 程 的 思想 来 自 集中 式 系统 时 代 ， 但 这 个 概念 在 高 级 系统 中 变 得 更 难以 定义 。 复 杂 性 在 
分 布 式 或 并 行 环境 中 ， 单 个 进程 可 以 使 用 多 个 控制 线程 来 利用 扩展 的 可 用 资源 。 不 考虑 操作 
环境 和 运行 什么 应 用 的 活 ， 所 有 事项 都 可 以 归结 为 运行 进程 。 进 程 可 能 需要 执行 几 个 计算 。 
一 些 环境 中 ， 特 别 是 分 布 式 和 并 行 环境 中 ， 人 允许 每 个 单独 的 计算 作为 一 个 独立 的 线程 来 执 
行 ， 以 便利 用 多 个 可 用 处 理 器 。 当 一 个 操作 系统 允许 一 个 以 上 的 执行 线程 时 ， 称 为 多 线程 
的 。2.2.1 节 介 绍 多 线程 进程 ， 多 线程 的 组 织 在 2.2.2 节 中 讨论 ，2.2.3 节 则 讨论 多 线程 进程 
的 各 种 支持 。 详 细 说 明 2.1 提供 多 线程 编程 的 POSIX 语言 支持 ， 常 用 C 和 C+ + 来 实现 。 详 
细 说 明 2.2 提供 支持 多 线程 编程 的 Java。 此 外 ， 附 录 中 的 外 科 手 术 调 度 程序 也 是 为 在 多 线程 
环境 中 操作 而 编制 的 。 








一 个 标准 ， amino RAMI: aa on 
dnt pthread _create (pthread | tt tid, o 1 
: conat pthredd attr t ‘Pater, o o aa 
= o vorar ((tstart) (veian), yous + aa); bo 
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_ public final void repen O- o : — 
ana 
public final void resume (); : 


ER- BRE | 





2.2.1 多 线程 进程 介绍 


在 传统 的 操作 系统 中 ， 每 个 进程 进程 
使 用 单个 地 址 空间 独立 和 运行， 并 使 用 
单个 控制 线程 。 在 分 布 式 和 并 行 环 境 
中 ， 进 程 允许 运行 多 个 执行 线程 。 这 
些 线程 有 时 也 称 为 轻 量 级 进程 。 每 个 堆栈 堆栈 
线程 有 自己 的 程序 计数 器 和 堆栈 ， 但 
与 兄弟 线程 共享 进程 的 地 址 空间 和 全 程序 计数 器 | 程序 计数 器 
局 变量 ， 如 图 2-2 所 示 。 在 所 有 非 并 
行 环境 ， 以 及 所 有 不 实现 共享 内 存 的 
并 行 环境 中 , 线程 也 共享 同一 个 
CPU。 同 一 个 父 进 程 的 所 有 线程 在 共 
享 地 址 空间 时 没有 保护 分 界 〈 如 果 使 
用 普通 线程 概念 而 又 不 能 接受 没有 内 
存 地 址 空间 保护 ， 最 好 使 用 真正 的 轻 
量 级 进程 来 代替 线程 )。 每 个 执行 线 
程 可 以 用 准 并 行 的 方式 运行 ， 从 而 可 
以 通过 利用 额外 的 可 用 资源 来 提高 吞 图 2-2 多 线程 进程 
吐 量 。 像 进程 一 样 ， 线 程 也 可 以 派生 
子 线程 。 由 于 创建 和 终止 线程 要 耗费 时 间 ， 因 此 许多 应 用 程序 就 创建 线程 池 ， 在 创建 新 线程 
或 子 线 程 时 重用 线程 。 现 在 我 们 来 解释 组 织 多 线程 进程 的 各 种 方法 。 


2.2.2 多 线程 进程 范例 


这 里 给 出 构造 同一 父 进 程 的 多 个 线程 的 三 个 常见 范例 ， 如 图 2-3 所 示 。 

1 专家 范例 。 在 专家 范例 中 ， 所 有 的 线程 平等 ， 但 为 父 进程 执行 自己 的 专用 服务 。 换 
名 话 来 说 ， 所 有 的 线程 能 够 但 不 要 求 执行 惟一 的 专用 服务 ， 对 每 个 线程 的 服务 请 求 直 接 由 父 
进程 触发 。 

2. CS 范例 。 在 C/S 范例 中 ， 客 户 接收 从 父 进 程 或 线程 来 的 所 有 请 求 ， 并 把 请 求 转 给 一 
个 适当 的 服务 器 线程 。 这 种 结构 是 基于 分 布 式 进程 的 C/S 范例 。 

3. 流水 线 范例 。 在 流水 线 范例 中 ， 一 个 线程 的 输出 是 下 一 个 线程 的 输入 ， 工 作 原 理 很 
像 流水 线 。 第 一 个 线程 的 输入 是 进程 的 输入 ， 最 后 一 个 线程 的 输出 是 进程 的 输出 。 这 种 结构 
是 基于 流水 线 并 行 软件 范例 。 
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线程 A、B、C 可 以 为 
进程 A 执 行 惟一 的 或 
相同 的 功能 。 


客户 线程 将 请 求 交 给 
适当 的 服务 器 线程 。 


一 段 流 水 线 范例 ， 第 1 段 的 输 

出 是 第 2 BUNA. 

第 2 段 的 输出 是 第 3 段 的 输入 。 
第 3 段 的 输 山 是 进程 和 的 输 山 。 


图 2-3 多 线程 的 进程 范例 


2.2.3 多 线程 支持 


内 核 可 以 支持 线程 ， 或 者 系统 可 以 对 线程 提供 用 户 级 支持 。 当 内 核 支持 线程 时 ， 内 核 在 
其 保护 内 存 空 间 中 管理 一 个 线程 状态 信息 表 。 固 定 尺 寸 的 状态 表 维 护 所 有 线程 的 状态 ， 每 个 
线程 一 个 项 ， 包 含 的 几 个 字段 表示 线程 的 状态 、 优 先 级 、 寄 存 器 值 和 其 他 有 关 信 息 。 当 一 个 
线程 阻塞 时 ， 内 核 使 用 一 个 单 级 的 调度 器 来 选择 运行 另 一 个 线程 。 这 个 新 线程 可 能 与 原 线程 
有 关 ， 也 可 能 无 关 而 来 自 另 一 个 进程 。 

当 线 程 在 用 户 空间 中 实现 时 ， 它 们 运行 在 管理 线程 的 运行 环境 的 顶端 。 因 此 ， 运 行 环境 
系统 维护 状态 信息 表 。 线 程 的 完整 功能 由 运行 环境 控制 ， 包 括 调度 ， 从 而 使 用 户 能 够 精确 控 
制 ， 比 如 选择 运行 哪个 线程 等 。 用 户 级 支持 使 得 支持 多 线程 程序 成 为 可 能 ， 哪 怕 所 用 的 底层 
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操作 系统 不 支持 运行 多 个 线程 。 

我 们 现在 比较 线程 的 这 两 种 实现 。 状 态 表 的 位 置 影响 线程 使 用 的 灵活 性 和 可 扩展 性 。 由 
于 内 核 级 线程 实现 方法 使 用 固定 尺寸 的 状态 表 ， 因 此 它 的 灵活 性 不 强 ， 更 重要 的 是 可 扩展 性 
也 不 强 。 调 度 是 另 一 个 重要 的 问题 。 支 持 内 核 级 线程 就 强制 程序 员 使 用 内 核实 现 方式 ; 相 
反 ， 如 果 线 程 是 在 内 核 之 上 的 用 户 级 实现 ， 程 序 员 就 能 控制 是 选择 执行 一 个 兄弟 线程 还 是 另 
一 个 进程 的 线程 。 如 果 速 度 很 重要 ， 就 必须 考虑 到 内 核 级 线程 的 切换 意味 着 使 用 (缓慢 的 ) 
内 核 陷阱 。 

考虑 到 这 些 问 题 ， 人 们 可 能 倾向 于 使 用 用 户 级 线程 。 但 是 ， 它 们 也 有 一 些 缺 点 。 具 体 
地 说 ， 内 核 之 上 的 任何 进程 ,包括 支 持 用 户 级 线程 的 进程 、 并 不 具有 内 核 那样 的 控制 能 力 。 
不 同 于 内 核实 现 方 式 ， 如 果 一 个 线程 控制 了 CPU， 用 户 级 实现 方式 不 能 强迫 线程 放弃 自己 的 
控制 地 位 ， 让 给 其 他 线 私 去 运行 。 即 使 创建 一 个 协议 来 使 线程 请 求 一 定量 的 执行 时 间 ， 用 户 
级 实现 方法 也 不 能 像 内 核 那 样 强制 协议 。 最 后 ， 用 户 级 实现 方法 还 要 注意 是 否 有 线程 执行 了 
导致 线程 被 内 核 阻 塞 的 命令 ， 如 果 有 则 整个 进程 (如 运行 用 户 级 线程 的 进程 ) 也 被 阻塞 。 一 - 
个 常用 方法 是 使 用 护 套 侦 程 来 捕获 线程 执行 的 每 个 系统 调用 。 护 套 例 程 首先 检查 以 确保 执行 
的 线程 不 会 阻塞 用 户 级 线程 管理 进程 ， 再 将 它 交 给 系统 。 还 必须 记 住 ， 任 何 一 个 看 上 去 无 害 
的 命令 都 可 能 引起 一 个 页 错误 ， 从 而 导致 整个 线程 包 被 阻塞 。 第 13 章 中 的 实例 研究 描述 了 
OSF 的 DCE (开放 式 软件 基金 会 的 分 布 式 计算 环境 ) 实现 用 户 级 线程 。 如 果 运 行 在 一 个 有 内 
核 级 支持 的 系统 之 上 ，DCE 也 能 利用 内 核 级 线程 实现 方法 。 调 度 问题 将 在 2.4 节 进 一 步 
讨论 。 


2.3 进程 管理 


进程 管理 是 用 来 控制 进程 及 其 所 有 组 件 。 进 程 管理 涉及 进程 及 如 下 所 有 相关 组 件 的 管 
H: 

4 地 址 空间 目录 。 

© 寄存 器 。 

4 程序 计数 器 。 

4 堆栈 指针 。 

4 系统 调用 状态 。 

4 所 有 相关 的 执行 线 湿 。 

4 所 有 的 进程 文件 及 其 状态 (打开 或 关闭 ;。 

当 进程 主动 或 被 动 地 放弃 一 个 处 理 器 的 控制 权 后 ， 整 个 状态 必须 切换 出 来 并 进行 保存 。 
进程 的 状态 包括 进程 的 所 有 相关 部 件 的 当前 状态 〈 如 前 面 所 列 )。 如 果 进 程 只 是 短暂 阻塞 ， 
所 付出 的 成 本 可 能 远 超 其 值 。 在 这 种 情况 下 ， 进 程 可 能 就 在 阻塞 等 待 期 间 空 转 或 紧 循 环 。 不 
幸 的 是 ， 系 统 很 难 确定 一 个 进程 要 等 竺 多久 ， 但 还 可 以 用 试探 法 。 其 中 一 些 选择 包括 总 是 空 
转 或 从 不 空转 。 如 果 你 从 不 空转 ， 系 统 可 能 执行 上 下 文 切换 ， 消 耗 掉 比 等 待 所 需 时 间 更 多 的 
处 理 时 间 。 如 果 你 总 是 空转 ， 并 且 进 程 阻 塞 的 时 间 很 长 ， 就 会 浪费 很 多 处 理 时 间 。 这 个 控制 
可 由 系统 使 用 ， 也 可 由 父 涝 程 使 用 。 进 程 管理 包括 下 列 责任 : 

4 创建 一 个 进程 。 

4 识别 进程 类 型 (在 2.3.1 节 中 讨论 )。 
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4 进程 迁移 (将 一 个 进程 的 执行 位 置 转移 到 另 一 个 处 理 器 或 主机 ， 在 2.3.2 节 中 讨论 )。 
4 调度 〈 什 么 时 候 运行 进程 ， 在 2.4 节 中 讨论 )。 
4 查询 进程 的 状态 。 
HERSKA (HEHE A, 
进程 已 退出 等 )。 
如 图 2-4 所 示 ， 进 程 可 能 处 于 三 个 ”新 进程 
状态 之 一 : 阻塞 、 运 行 和 等 待 〈 可 运行 
但 当前 没有 执行 )。 进 程 阻塞 可 能 是 因 
为 等 待 输入 ， 访 问 一 个 资源 ， 或 者 在 跟 
另 一 个 协作 进程 同步 。 进 程 在 就 绪 状 态 
可 能 因为 它 是 一 个 新 进程 ， 它 刚刚 取消 图 24 进程 状态 
阻塞 ， 或 者 它 使 用 了 最 大 的 时 间 片 并 不 
得 不 被 转 出 。 详 细 说 明 2.3 描述 了 Amoeba 的 进程 管理 系统 。 最 后 ， 描 述 进程 管理 的 更 深 人 
知识 ， 包 括 分 布 式 和 实时 进程 调度 ， 将 在 第 7 章 中 讲解 。 


退出 














2.3.1 进程 类 型 


从 调度 者 的 角度 来 看 ， 在 分 布 式 和 并 行 环境 中 有 两 大 类 进程 。 第 一 类 是 不 可 分 割 的 进 
程 ， 即 所 有 进程 是 独立 的 .、 不 可 分 割 的 ， 并 且 可 能 大 小 不 同 。 对 这 些 进 程 ， 不 可 能 分 割 处 理 
负荷 ， 整 个 进程 必须 分 配给 单个 处 理 器 。 这 样 的 进程 不 能 利用 分 布 式 和 并 行 环境 中 额外 的 可 
用 资源 。 

第 二 类 是 可 分 割 的 进程 ， 可 以 根据 算法 特性 分 割 成 更 小 的 子 进程 或 任务 (也 就 是 线程 )。 
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只 有 当 所 有 任务 都 完成 时 ， 整 个 工作 才 完 成 。 每 个 任务 可 作为 一 个 独立 的 进程 。 某 个 进程 的 

相关 任务 可 以 表示 成 一 张 图 ， 其 中 顶点 表示 任务 ， 边 表示 进程 间 的 交互 。 这 张 图 通常 称 为 任 

务 交 互 图 (task interaction graph，TIG)。 如 果 进 程 间 有 优先 关系 ， 图 中 的 边 可 有 方向 《有 箭 

头 )， 也 就 是 说 一 个 进程 必须 优先 于 其 他 进程 被 执行 。 而 且 ， 这 一 组 进程 的 关系 还 可 能 要 求 
[40 | 并 发 。 详 细 说 明 2.4 给 出 了 一 个 可 分 割 进程 的 例子 ， 以 及 TIG 的 用 法 。 


amaaa ne 


Rn cs HR. CTD Re Fd: 














HARES, Rh, oe, 


2.3.2 负荷 分 布 和 进程 迁移 


分 布 负荷 的 主要 目的 是 更 有 效 地 利用 资源 和 获得 结果 。 这 一 目的 也 许 应 该 称 为 负荷 平 
衡 ， 努 力 使 系统 的 负荷 达到 相等 的 吞吐 量 ， 用 来 尽力 帮助 过 载 的 资源 ， 或 者 称 为 负荷 分 担 。 
进程 负荷 的 分 布 涉及 到 几 个 问题 ， 包 括 利 用 远程 处 理 器 。 负 荷 分 布 通过 进程 迁移 来 完成 ， 将 
进程 和 所 有 相关 的 状态 信息 重新 安置 到 另 一 个 处 理 器 上 。 如 果 进 程 是 不 可 分 割 的 ， 则 整个 进 
程 必须 迁移 到 另 一 个 位 置 ; 如 果 进 程 是 可 分 扰 的 ， 则 只 有 一 部 分 必须 被 迁移 。 由 于 可 分 制 的 
进程 通常 依靠 改变 共享 数据 ， 因 此 必须 特别 小 心地 判断 可 分 割 进程 的 一 部 分 是 否 被 分 布 到 远 
ETR SA, 一 旦 一 个 进程 迁移 了 ， 它 就 在 本 地 调度 。 
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负荷 分 布 的 算法 有 两 个 部 件 ， 它 们 可 以 一 起 或 不 一 起 实现 。 所 有 部 件 可 以 用 集中 式 算法 
或 分 布 式 算法 来 解决 。 第 一 个 是 信息 收集 部 件 ， 第 二 个 是 进程 选择 部 件 。 信 息 收集 部 件 负责 
决定 收集 什么 信息 ， 并 且 收 集 这 些 信息 ， 然 后 选择 一 个 适合 的 迁移 对 象 。 最 成 功 的 信息 收集 
算法 根据 需求 收集 信息 ， 或 者 当 某 个 节点 的 状态 改变 了 预定 的 数量 (如 CPUT 10%) 或 


改变 了 负荷 状态 。 根 据 实际 的 算法 ， 系 统 可 能 有 两 个 或 三 个 负荷 状态 。 两 状态 的 算法 认为 一 


个 节点 要 人 么 过 载 ， 要 人 么 负荷 不 足 。 三 状态 的 算法 增加 了 一 个 合适 加 载 的 状态 。 

可 用 资源 的 辨认 是 一 项 复杂 的 任务 。 辨 认 算 法 也 可 以 是 集中 的 或 分 布 的 。 集 中 式 算法 全 
有 单个 处 理 器 〈 或 节点 )， 负 责 所 有 系统 的 所 有 信息 ， 注 意 它们 当前 的 负荷 和 可 用 资源 。 如 
果 一 个 进程 想 迁 移 ， 它 可 以 联系 集中 式 管 理 者 ， 索 要 整个 系统 的 信息 。 这 个 集中 式 管理 者 必 
须 高 效 操作 和 及 时 更 新 ， 轩 此 最 有 效 的 方法 是 维护 最 少 信息 以 使 整个 操作 流 畅 。 下 面 给 出 辨 
认 算 法 必须 回答 的 一 系列 问题 。 

+ 所 有 进程 平等 对 待 ， 还 是 某 些 进程 有 更 高 优先 级 ? 

4 资源 能 否 通 过 辨认 一 个 CPU 空闲 了 x 微 秒 来 辨认 自己 空闲 或 可 用 ? 

4 如 何 判断 一 个 资源 将 空闲 多 长 时 间 ? 在 分 布 式 系统 ， 有 空闲 CPU 的 系统 其 用 户 是 去 喝 

PWE, LEUR? 如 果 用 户 回 来 怎么 办 ? 

© 如 果 不 搜索 或 发 现 空闲 处 理 器 ， 如 何 评估 某 个 特定 节点 的 负荷 9 这 个 评估 是 静态 地 还 

是 动态 地 计算 ? 

4 迁移 能 提高 其 他 进程 的 本 地 性 能 吗 ? 它 对 远程 节点 有 消极 影响 吗 ? 

4 远程 资源 的 日 常用 户 能 杀 死 迁移 进程 吗 ?日 常用 户 能 强迫 一 个 进程 迁移 到 另 一 个 节点 吗 ? 

4 进程 迁移 过 程 中 发 生 系统 故障 的 风险 是 什么 ? 预防 进程 迁移 过 程 中 发 生 系统 故障 的 代 

价 是 多 大 ? 

4 在 负荷 分 布 时 ， 成 员 是 自愿 的 还 是 强迫 的 ? 

分 布 式 解决 方案 一 般 包 含 广播 其 需求 或 可 用 资源 。 因 此 一 个 节点 可 以 发 出 一 个 消息 ， 
比如 “我 现在 有 一 个 空闲 的 CPU， 如 果 需 要 请 通知 我 "。 为 了 使 系统 免 受 广播 信息 的 勾 炸 ， 
一 个 节点 可 以 广播 “我 需要 另 一 个 处 理 器 ， 能 帮 有 我 吗 ?”， 然 后 那些 有 可 用 资源 的 节点 就 只 跟 
那个 需要 帮助 的 节点 联系 。 有 了 这 个 信息 ， 就 可 以 选择 迁移 对 象 。 

现在 我 们 确定 了 迁移 对 象 ， 我 们 必须 决定 迁移 哪个 进程 。 因 此 ， 如 前 面 所 提 及 ， 第 二 个 
部 件 是 进程 选择 部 件 。 这 个 部 件 必 须 考虑 几 个 问题 ， 包 括 所 要 迁移 给 定 进程 的 负荷 量 ， 给 定 
进程 对 计算 机 体系 结构 的 依赖 性 ， 给 定 进程 的 预期 执行 时 间 。 如 果 负 荷 高 而 执行 时 间 不 长 ， 
则 这 个 进程 不 是 一 个 好 的 迁移 选择 。 相 反 ， 如 果 进 程 几乎 是 新 创建 的 (可 能 就 是 引起 系统 去 
搜索 迁移 对 象 的 那个 进程 )， 它 能 被 迁移 并 且 在 远程 节点 从 头 到 尾 运 行 。 在 远程 节点 完全 执 
行 比 抢占 后 迁移 的 进程 更 能 减少 成 本 。 下 面 是 考虑 进程 迁移 成 本 的 部 分 要 点 列表 。 

4 迁移 进程 的 初始 通信 延迟 是 多 少 ? 

4 返回 进程 结果 到 主人 节点 的 最 终 通信 延迟 是 多 少 ? 

4 进程 的 各 个 部 分 如 果 没 有 迁移 到 同一 个 节点 ， 各 部 分 之 间 的 通信 成 本 是 多 少 ? 

4 总 的 来 回 时 间 是 否 优 于 不 迁移 这 个 进程 ? 

4 每 个 处 理 器 的 处 理 能 力 如 何 ? 

4 进程 的 各 个 部 分 如 果 没 有 迁移 到 同一 个 节点 ， 如 何 维护 各 个 部 分 之 间 共 享 的 可 变数 据 

的 一 致 性 ? 
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4 如 何 将 虚拟 内 存 随 江 移 进程 一 同 转移 (在 第 4 章 中 讨论 )? 

4 如 果 系 统 中 存在 异 构 ， 如 何 协调 其 间 的 差异 ? 

进程 迁移 涉及 的 另 一 个 问题 是 在 异 构 环境 中 操作 的 复杂 性 。 异 构 包 括 使 用 不 同类 型 的 计 
算 机 ， 这 就 要 求 迁 移 必须 能 够 处 理 不 同 速 度 的 不 同 处 理 器 、 不 同 的 软件 配置 ， 以 及 更 困难 的 
数据 表示 方法 。 不 同 的 数据 表达 意味 着 迁移 一 个 进程 可 能 还 包括 数据 翻译 。Maguire 和 Smith 
[Masm88] 提出 了 一 个 方法 是 使 用 一 种 外 部 数据 表示 (external data representation，EDR)。 这 
个 通用 表示 方法 可 被 分 布 式 系统 中 的 所 有 参与 成 员 使 用 ， 以 减少 翻译 工作 量 。 图 2-6 显示 只 
有 5 种 不 同类 型 的 计算 机 ， 却 可 能 出 现 20 种 不 同 的 翻译 。 如 图 2-7 所 示 ， 通 过 将 数据 翻译 成 
一 个 通用 的 外 部 数据 表示 ， 就 只 有 10 种 翻译 了 。 执 行 跨 平台 的 进程 迁移 所 需要 的 软件 数量 
就 可 大 大 减少 。 翻 译 器 要 处 理 的 最 重要 问题 之 一 包括 数字 表示 ， 因 为 不 同 的 系统 使 用 不 同 的 
尾数 、 指 数 和 负数 表示 方法 〈 零 的 表示 方法 ) 等 。 





图 26 没有 外 部 数据 表示 的 数据 翻译 图 2-7 带 有 外 部 数据 表示 的 数据 翻译 


还 有 一 个 问题 是 : 何 时 该 用 集中 式 算法 ， 何 时 该 用 分 布 式 算法 ? 在 并 行 系统 或 分 布 式 系 
统 中 使 用 一 个 处 理 器 池 和 多 个 远程 终端 ， 为 了 对 整个 系统 的 情况 更 容易 把 握 ， 因 此 宜 于 采用 
集中 式 算 法 ， 否 则 使 用 分 布 式 算法 更 好 。 
2.4 进程 调度 

在 带 有 多 个 处 理 器 的 环境 中 (并行 或 分 布 式 )， 调 度 成 为 一 件 有 意思 的 事 。 在 实时 环境 
中 ， 时 间 不 是 无 足 轻 重 的 ， 而 是 相当 重要 的 。 因 此 ， 分 布 式 实时 环境 必须 考虑 通信 延迟 ， 并 
尽力 符合 它们 的 时 间 约 束 。 在 2.4.1 节 中 我 们 来 看 看 两 种 识别 调度 进程 的 方法 。 在 2.4.2 节 
解释 调度 器 的 各 种 组 织 方法 。 分 布 式 调度 算法 更 深入 的 讨论 在 第 7 章 中 ， 其 它 有 关 信息 在 第 
9 章 中 讨论 。 


2.4.1 识别 用 于 调度 的 进程 
识别 可 调度 的 任务 的 最 简单 方法 是 所 谓 的 轮 询 。 在 轮 询 设 计 中 ， 调 度 器 有 一 份 完整 的 可 
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能 需要 系统 服务 的 进程 的 列表 。 如 名 字 所 示 ， 它 在 整体 上 设计 成 一 个 循环 。 这 个 循环 不 断 询 
问 每 个 进程 是 否 需 要 系统 。 如 果 回 答 是 ， 则 符合 条 件 ; 如 果 回 答 不 是 ， 则 循环 继续 询问 下 一 
个 进程 。 由 于 这 个 方法 不 是 交互 式 的 ， 这 种 设计 更 常用 于 特定 目的 的 调度 ， 而 不 是 整个 系统 
的 调度 。 一 个 特定 目的 的 调度 可 能 控制 访问 一 个 网 络 或 者 其 他 IO 设备 。 详 细 说 明 2.5 描述 
了 一 个 使 用 轮 询 来 调度 访问 网 关 的 例子 。 














= 
NS — o 
L oe APR? ld CBS). 8 La ane) 
2. “AR”. 


3. “你 要 访问 网 关 吗 ? ”提供 服务 )。 
“« 是 的 ” 


. <E” CARMA 
“这 是 我 的 消息 ， 完 毕 








对 于 集中 式 系统 ， 商 级 系统 可 能 是 基于 中 断 的 。 中 断 是 发 给 系统 的 一 个 简单 信号 ， 表 
示 需 要 某 类 设备 。 因 此 ， 中 断 也 可 用 作 识别 调 度 进程 的 方法 。 不 像 轮 询 系 统 ， 中 断 并 不 保证 
可 以 立即 访问 想 要 的 系统 设备 。 相 反 ， 中 断根 据 进 程 的 优先 级 和 请 求 的 类 型 (根据 中 断 的 类 
型 )， 将 进程 放 和 人 相应 的 调度 队列 。 些 外 ， 还 有 第 三 个 概念 是 时 间 中 断 ， 包 括 计 时 器 的 使 用 。 
每 当 一 个 特定 中 断 出 现 ， 计 时 器 就 重 置 。 如 果 一 个 中 断 没 出 现 ， 而 计时 器 又 超时 ， 则 产生 一 
个 中 断 。 
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2.4.2 调度 器 的 组 织 


有 两 种 方法 来 组 织 调度 器 的 整体 功能 。 对 于 带 有 优先 关系 的 可 分 割 进程 ， 调 度 器 一 般 按 状 
态 驱动 方式 来 组 织 。 各 种 状态 的 组 织 依赖 于 进程 及 其 各 个 部 件 之 间 特 定 的 优先 关系 。 如 果 未 遵 
守 优先 关系 ， 则 最 终结 果 可 能 不 正确 ， 并 且 不 可 避免 地 会 污染 数据 。 一 组 进程 中 存在 优先 关 
系 ， 可 能 会 要 求全 部 并 发 运行 。 如 果 一 个 进程 没有 同时 调度 ， 整 个 工作 可 能 就 要 花费 两 倍 时 间 
来 执行 。 因 此 程序 员 必 须 通 过 调度 算法 来 安排 精确 调度 ， 否 则 调度 器 就 是 言 人 贞 马 。 所 有 相关 
进程 一 起 调度 也 常 称 为 群 调 度 [Ous82]。 详 细 说 明 2.6 提供 了 表示 精确 调度 优 于 盲 调度 的 例子 。 

在 一 个 分 布 式 系统 ， 如 果 负 荷 是 可 分 割 的 ， 调 度 器 必须 注意 所 有 相关 成 本 。 其 中 一 个 最 重 
要 的 相关 成 本 是 由 于 通信 而 导致 的 反应 时 间 延 迟 ， 包 括 把 进程 及 其 所 有 部 分 送 到 相应 处 理 器 所 
需要 的 时 间 。 在 分 布 式 系统 中 ， 传 输 进 程 信息 也 会 是 一 个 重要 的 时 间 因 素 。 在 NUMA 系统 中 如 
果 进 程 被 指派 到 其 他 地 方 执行 的 话 ， 调 度 器 还 必须 考虑 获取 和 移动 数据 所 需 的 通信 成 本 。 
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“上 而 的 例子 描述 了 对 相关 进 程 进行 适当 调度 的 好 处 。 在 精确 调度 中 ， 关于 进程 的 信 
例 程 的 程序 员 处 获得 。 在 言 调度 中 ， 程序 员 没有 提供 任何 信息 给 调度 器 。 
BEA 有 五 个 相关 进程 。 这 些 进程 都 产生 可 被 下 一 阶段 相同 进程 利用 的 信息 。 执 
行 一 个 阶段 所 过 的 信 息 依 彬 于 前 一 阶段 完成 的 所 有 进程 。 这 种 关系 称 为 生产 者 /消费 者 关 
Ro 我 们 假定 这 五 个 相关 进程 有 三 个 基本 执行 阶段。 图 2-9 显示 了 精确 调度 的 结果 ， 而 图 
2-10 显示 了 语调 度 的 结果 。 在 图 2-10 中 可 看 出 ， 进程 1 汉 3 六 千 四 客 而 不 二 进入 第 二 和 














| 第 三 阶段 的 执行 ， 直 到 进程 4 和 5 也 被 调度 。 








状态 驱动 调度 器 常常 通过 协同 例 程 来 实现 ， 具 体 地 说 ， 进 程 所 有 处 于 特定 状态 的 方面 都 
被 调度 。 当 一 个 状态 完成 后 ， 调 度 器 就 为 下 一 状态 调度 适当 进程 。 状 态 驱 动 调度 器 的 一 个 例 
TÆ IBM 的 OS/2 Presentation Manager”。 这 个 程序 使 用 协同 例 程 来 调度 进程 ， 并 维护 协同 及 
调度 用 户 窗口 所 需要 的 优先 关系 。 优 先 关系 方面 的 知识 将 在 第 9 章 讲述 。 

如 果 没 有 优先 关系 ， 调 度 器 的 组 织 就 用 我 们 所 学 过 的 集中 式 操作 系统 同样 的 方法 。 具 体 
地 说 ， 它 可 以 使 用 诸如 循环 调度 、 最 短工 作 优 先 调度 、 优 先 权 调度 (包括 派生 的 前 景 /背景 
和 剥夺 优先 权 调 度 ) 这 样 的 算法 。 


2.5 小 结 


内 核 是 操作 系统 中 非常 重要 的 部 分 。 在 本 章 ， 我 们 已 经 介绍 了 一 些 基 本 的 概念 ， 这 些 概 
念 中 的 大 部 分 将 在 第 3 章 和 第 4 章 中 进一步 深入 学 习 。 并 行 和 分 布 式 系统 倾向 于 做 成 微 内 
核 ， 这 种 设计 特别 适用 于 需要 可 移植 性 和 灵活 性 的 分 布 式 系 统 。 要 求 效率 的 实时 系统 也 使 用 
微 内 核 。 内 核 负 责 许 多 事情 。 在 本 章 我 们 着 重 分 析 了 进程 和 线程 的 概念 ， 以 及 进程 管理 和 调 
度 。 进 程 是 可 以 分 割 的 ， 由 多 个 任务 组 成 ， 并 拥有 几 个 执行 线程 。 在 分 布 式 系统 ， 内 核 不 仅 
决定 进程 将 在 哪里 执行 ， 还 要 负责 本 地 调度 。 为 了 与 内 核 及 其 他 进程 通信 ， 需 要 用 到 进程 间 
通信 ， 这 方面 将 在 第 3 章 详 述 。 内 核 也 负责 内 存 管 理 ， 这 方面 将 在 第 4 章 讨 论 。 


2.6 参考 文献 


下 面 的 参考 文献 可 提供 关于 内 核 及 其 功能 和 实现 的 更 广泛 信息 。 1 A1197，BGMR96， 
Cha97, Cou98, Fla96, Kri39, KSS97, Lap97, LeBe96 和 RoRo96]。 与 本 章 中 内 容 有 关 的 一 些 
传统 研究 论文 有 [ ABLLOL, ArFi89, BrJo94, Caku88, Cve87, EAL95, ELZ86, Esk89, Fer89, 
FeZh87, GeYa93, Krli87, Kun91, LHWS96, Lo88, Mul93b, PTS88, SKS92, SWP90， 
TaKa94, VLL90, WaMo85 和 Zay87]. 

下 面 提供 一 些 与 内 核 问 题 有 关 的 Intemet 站 点 资源 。Anderson Bershad, Lazowski 和 Levy 
的 论文 [ABLL91] 可 在 http: //www.cs. berkeley.edu/ ~ brewer/cs262/Scheduler. pdf 找到 。Sun 
Microsystems “提供 了 一 个 专注 于 线程 的 主页 http: //www. sun. com/software/Products /Developer- 
products/sig/threads/index.html。Sun 的 站 点 也 包含 使 用 线程 的 程序 范例 ， 可 在 http: // 
www. sun. com/workshop/sig/ threads/Berg-Lewis/examples .html 看 到 。 另 一 个 关于 线程 的 主页 地 址 
为 http: /fwww.mit.edu : 8001/people/proven/pthreads.html。 Amoeba 主页 地 址 为 http: // 


www. am. cs. vu. nlo 
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习题 


2.1 
2.2 


2.3 
2.4 
2.5 
2.6 


指出 并 说 明 相对 于 单 内 核 ， 使 用 微 内 核 设 计 高 级 系统 内 核 的 三 个 主要 优点 。 
对 下 面 每 个 线程 结构 范例 列 出 一 个 可 能 的 应 用 。 
a. 专家 范例 。 

b. C/S 范例 。 

c. 流水 线 范例 。 

指出 并 说 明 内 核 支持 的 线程 的 优点 。 

指出 并 说 明 用 户 级 支持 线程 的 优点 。 

何 时 不 利于 切换 出 一 个 阻塞 进程 ? 

假设 有 一 个 进程 要 迁移 ， 进 程 已 经 在 UNK 环境 下 编译 执行 。 请 说 明 将 这 个 新 进程 
迁移 到 如 下 各 个 节点 的 好 处 和 随 之 产生 的 问题 。 
节点 1 

4 UNIX 环境 。 

© 每 个 方向 的 通信 要 花费 150 个 时 间 单 元 。 

4 处理 器 当前 使 用 80% 。 

© 处 理 器 速度 为 100MHz。 

节点 2 

4 UNIX 环境 。 

4 每 个 方向 的 遥 信 要 花费 250 个 时 间 单 元 。 

4 处 理 器 当前 使 用 60% 。 

4 处 理 器 速度 尖 60MHz。 

节点 3 

4 Windows98™ INER , 

4 每 个 方向 的 通信 要 花费 50 个 时 间 单 元 。 

4 处 理 器 当前 使 用 30%. 

4 处 理 器 速度 为 200MHz。 

节点 4 

4 Windows-NT 环境 。 

4 每 个 方向 的 通信 要 花费 1000 个 时 间 单 元 。 

4 处 理 器 当前 使 用 20%。 

4 处 理 器 速度 为 260MHz。 

TAS 

4 Windows3 . 1™ IF 3% 

4 每 个 方向 的 通信 要 花费 10 个 时 间 单 元 。 

© 处 理 器 当前 使 用 0% 。 

4 处 理 器 速度 为 60MHz。 


2.7 编写 一 个 程序 来 进行 迁移 决策 。 这 个 程序 应 该 适应 OS 环境 的 类 型 、 通 信 成 本 、 


处 理 器 应 用 和 处 理 器 速度 。 此 外 ， 用 户 应 该 能 够 为 这 些 因素 的 重要 性 分 别 加 权 。 


#2 内 B 





2.8 


2.9 


2.10 假设 系统 为 线程 调度 提供 一 个 二 


根据 用 户 要 求 的 重要 性 加 权 〈 所 有 因素 的 加 权 数 之 和 是 1.00) ， 判 断 练习 2.6 FH 


个 站 点 是 最 佳 的 迁移 对 象 。 程 序 应 该 使 用 如 下 公式 : 
Total Weight =[ Env_WT * (1/0)] + {1- (Com WT * Com_Cost)] + 
[1- (Util Wt * Util)] + [Speed Wt * Speed] 


对 于 环境 加 权 (10)， 如 果 环 境 匹 配 ， 则 它 乘 以 1; 如 果 环 境 不 匹配 ， 则 它 


FEV 0。 

用 练习 2.6 中 的 五 个 节点 和 下 面 的 权 值 来 测试 程序 。 
权 值 1 

4 环境 .25。 

4 通信 成 本 .25。 

4 处 理 器 当前 使 用 .25 RRE). 
4 处 理 器 速度 .25 (GRR). 
权 值 2 

4 环境 .75。 

4 通信 成 本 .25。 

4 处 理 器 当前 使 用 0 ( 越 低 越 好 ) 。 
4 处 理 器 速度 0 ( 越 高 越 好 )。 
权 值 3 

4 环境 .55。 

4 通信 成 本 .15。 

4 处 理 器 当前 使 用 .20 〈 越 低 越 好 )。 
4 处理 器 速度 10 RARE). 
权 值 4 

4 环境 .15。 

4 通信 成 本 ,55。 

4 处 理 器 当前 使 月 .20 ( 越 低 越 好 )。 
4 处 理 器 速度 .10 ( 越 高 越 好 )。 


假设 迁移 策略 允许 资源 的 属 主 立即 CASS) 杀 死 所 有 在 它 的 资源 上 运行 的 进 


程 〈 比 如 用 户 稍 息 片 刻 后 返回 了 ) ， 会 影响 下 面 哪些 项 目 ? 
1. HEBRE R, 

2. 执行 进程 的 状态 信息 。 

3. 执行 进程 驻 留 在 系统 内 存 中 的 数据 。 

4. 整个 分 布 式 系 统 的 整体 效率 。 


在 一 个 使 用 7 种 不 同体 系 结构 ， 而 又 不 采用 EDR 的 蜡 构 环境 中 ， 和 需要 多 少 种 翻 


译 ? 选 做 题 ， 有 和 没有 EDR 所 需 翻 译 数 的 公式 是 什么 ? 


级 优先 权 系 统 : 低 优 先 权 给 用 户 级 线程 ， 高 优先 
权 给 内 核 线程 。 调 度 器 使 用 带 有 优先 抢占 的 最 短工 作 优 先 调度 算法 (任何 新 的 高 
优先 权 工 作 到 达 都 会 抢占 正在 运行 的 低 优先 权 工 作 )。 计 算 每 个 线程 总 的 加 权时 间 
和 每 类 线程 的 平均 等 待 时 间 。 所 有 标记 U 的 线程 是 用 户 级 线程 ， 标 记 K 的 是 内 核 
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51 级 线程 。 优 先 权 相同 的 线程 按 先 来 先 用 的 原则 调度 。 
到 达 时 间 线程 编号 需要 的 处 理 时 间 
0 Ul 12 
3 K2 5 
9 K3 3 
11 U4 5 
27 K4 7 
27 Us 2 


2.11 ” 写 一 个 程序 实现 练习 2.10 所 描述 的 带 有 优先 抢占 的 最 短工 作 优 先 调 度 ， 并 用 练 
习 2.10 中 所 给 出 的 数据 和 你 自己 的 数据 来 测试 这 个 程序 。 
[32 2.12 说 明 系 统 调 诬 使 用 轮 询 调度 器 的 两 个 缺点 。 





第 3 章 ， 进 程 间 通 信 


要 顺利 地 将 各 部 分 组 织 在 一 起 ， 一 个 重要 的 因素 是 建立 有 效 的 通信 方式 。 因 此 ， 如 果 我 
们 要 在 任何 高 级 环境 中 获得 用 多 个 进程 处 理 同一 个 问题 的 好 处 ， 就 一 定 要 使 用 适当 和 有 效 的 
通信 方式 ， 尤 其 是 进程 间 通 信 (interprocess communication，IPC)。 这 是 一 个 基本 的 概念 ， 甚 
至 用 于 在 最 简单 的 计算 机 游戏 中 ， 以 允许 用 户 通过 网 络 参与 。 在 本 章 中 ， 我 们 讨论 各 种 类 型 
的 进程 间 通 信 方 法 。 这 些 方法 在 底层 实现 并 涉及 系统 调用 ， 或 通过 语言 支持 实现 。 我 们 讨论 
进程 间 通 信 的 四 个 主要 类 型 。3,1 节 介 绍 了 在 分 布 式 系统 中 实现 进程 间 通 信 时 能 影响 机 制 选 
择 的 几 个 因素 ，3.2 节 介 绍 消息 传输 ，3.3 节 研 究 管道 ，3.4 节 讨 论 套 接 字 的 细节 ，3.5 节 介 
绍 远程 过 程 调用 。 第 4 章 讨 论 另 一 种 通过 使 用 共享 内 存 来 进行 通信 的 方法 。CORBA 和 DCOM 
提供 的 对 象 间 通信 方式 将 在 第 6 章 讲 述 。 


3.1 选择 因素 


影响 程序 员 为 某 一 给 定 的 应 用 选择 进程 间 通 信 方 法 的 因素 有 很 多 ， 以 下 是 一 些 应 该 考虑 
的 问题 : 

4 程序 员 当 前 的 技能 (这 昌 不 是 选择 某 一 特定 方法 的 具体 原因 ， 但 它 确实 影响 许多 系 
统 )。 因 为 如 果 你 以 前 实现 过 某 种 IPC 方法 ,那么 再 次 去 实现 就 简单 多 了 。 

+ IPC 机 制 对 程序 员 的 透明 性 。 程 序 员 知道 的 细节 越 少 ， 出 错 的 几率 也 就 越 低 ， 但 同时 
也 增加 了 从 细节 中 抽象 和 自动 处 理 它们 的 费用 。 

4 组 成 分 布 式 环境 的 各 个 系统 所 支持 的 方法 。 很 显然 ， 除 非 该 机 构 客户 定制 了 结构 杠 
架 ， 否则 不 容易 选中 不 被 需求 环境 所 支持 的 方法 。 

4 系统 将 来 的 可 扩充 性 。 这 个 应 用 是 否 将 一 直 运行 于 C/S 模式 下 ”我 们 是 否 会 在 超越 单 
机 和 /或 文件 空间 的 范围 通信 ? 如 果 你 的 选择 限制 了 超越 当前 的 文件 空间 的 能 力 ， 就 
要 辆 牲 将 来 的 扩展 性 。( 记 住 ; 许多 原型 直接 应 用 到 产品 中 ， 因 此 最 好 不 要 假设 还 会 
有 重 写 原 代码 的 情况 )。 

4 支持 进程 的 移植 。 如 果 一 个 IPC 方法 禁止 不 同文 件 系统 间 的 通信 ， 那 么 进程 就 不 能 在 
文件 系统 域 之 外 进行 移植 。 

4 机 制 是 否 已 经 标准 化 ， 从 而 最 大 程度 地 允许 各 种 系统 能 够 加 和 人 分布 式 系统 中 ， 并 都 具 
有 执行 通信 的 能 力 ? 

4 机 制 的 效率 。 这 在 具有 时 间 限 制 的 分 布 式 实时 系统 中 尤其 需要 。 

记 住 以 上 几 点 ， 我 们 无 始 讨论 各 种 IPC 方法 。 


3.2 消息 传递 


消息 传递 (message passing) 允许 两 个 进程 间 通 过 将 共享 数据 物理 地 拷贝 到 另 一 进程 的 
地 址 空间 来 进行 通信 ， 这 通过 向 包含 共享 数据 的 进程 传送 消息 来 完成 。 这 种 形式 的 通信 在 不 
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共享 内 存 空间 的 两 个 进程 间 非 常 普 遍 ， 只 要 它们 具有 各 自 的 内 存 ， 而 不 管 在 物理 上 是 不 同 的 (54) 
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系统 还 是 相同 的 系统 。 消 息 传输 通信 包括 类 似 如 下 形式 的 发 送 和 接收 原 语 。 

send (b,msq); 

receive (a, msg); 
这 些 可 以 是 阻塞 或 非 阻 塞 原 语 。 为 了 理解 阻塞 和 非 盟 塞 原 语 之 间 的 区 别 ， 让 我 们 先 看 一 个 假 
设 的 情景 : 苏 珊 打 电 话 给 史蒂芬 并 留 下 信息 ， 信 息 中 包含 一 个 问题 并 要 求 回电 。 这 种 情况 
下 ， 苏 珊 有 两 种 选择 ， 坐 在 电话 旁边 等 待 斯 蒂 芬 的 回电 或 者 是 做 其 他 工作 直到 接 到 上 述 的 回 
电 。 第 一 种 情况 类 似 于 阻塞 原 语 ， 第 二 种 情况 则 类 似 于 非 阻 塞 原 语 的 消息 传输 情况 。 每 种 选 
择 都 有 其 优 缺 点 ， 我 们 将 分 别 在 3.2.1 和 3.2.2 节 中 进行 描述 。 另 外 ， 消 息 可 能 传输 至 一 个 
或 一 组 进程 ， 这 种 情况 将 在 3.2,3 节 中 进行 描述 。 


3.2.1 阻塞 原 语 


假设 苏 珊 留 给 斯 蒂 芬 的 信息 是 他 们 准备 一 个 令 莉 恩 惊 喜 的 聚会 ， 苏 融和 斯 蒂 芬 决定 分 工 
WTF: 

苏 珊 的 任务 ; 

. 预订 蛋糕。 

. RR 

. 让 斯 蒂 芬 知道 蛋糕 已 经 取 回 。 

. 接 斯 蒂 芬 的 电话 ， 得 知 莉 恩 因 宴 会 而 惊喜 。 

5. 在 莉 恩 惊喜 后 把 蛋糕 带 到 聚会 地 点 。 

斯 带 芬 的 任务 ; 

1. 打 电 话 给 莉 恩 。 

2. (确认 蛋糕 已 经 取 回 。) 

3. 把 莉 恩 带 到 宴会 -。 

4. 让 苏 珊 知道 莉 恩 在 聚会 地 点 ， 并 且 达 到 目的 。 

如 果 苏 珊 没 有 等 斯 蒂 芬 的 回电 ， 那 么 她 也 许 会 在 进入 宴会 厅 之 前 就 在 人 口 处 碰 到 他 们 而 
破坏 了 惊喜 的 效果 。 因 此 ， 苏 融和 斯 蒂 芬 不 但 需要 通信 ， 而 且 还 需要 同步 。 

如 同 苏 珊 和 斯 蒂 芬 ， 当 多 个 进程 解决 同一 任务 时 ， 它 们 不 仅 需 要 通信 ， 还 需要 同步 。 
因此 对 于 这 些 进程 来 说 ， 一 个 阻塞 消息 传输 的 原 语 ， 也 称 同步 原 请 ， 可 以 完成 要 求 。 阻 塞 原 
语 不 立即 返回 控制 权 给 进程 。 一 个 send 阻塞 直到 确认 为 止 ， 而 receive 阻塞 直到 消息 被 
接收 。 当 一 个 进程 被 阻塞 ， 它 在 解除 阻塞 之 前 不 能 继续 执行 。 因 此 ， 两 个 进程 不 仅 需要 通信 
而 且 还 需要 同步 。 如 果 你 想 执 行 同 步 ， 可 能 它 很 有 用 ， 但 是 阻止 了 并 发 性 。 

阻塞 原 语 可 以 使 用 旨 冲 ， 也 可 以 不 使 用 缓冲 。 当 使 用 时 ,缓冲 区 也 称 为 邮箱 。 在 各 自 的 
进程 阻塞 解除 之 前 ， 对 发 送 的 确认 或 接收 到 的 消息 放置 在 一 个 缓冲 中 。 这 个 缓冲 可 位 于 内 核 
的 地 址 空间 也 可 在 进程 的 地 址 空间 。 在 分 布 式 环境 中 ， 缓 冲 由 接收 者 的 位 置 确定 ， 这 也 产生 
了 一 个 问题 ， 如 果 接 收 者 还 没有 发 送 receive 命令 ， 内 核 就 不 知道 该 把 消息 放 在 何 处 ! 

当 阻 塞 原 语 执行 时 没有 缓冲 ， 那 么 在 内 核发 出 receive 通知 之 前 ,传输 被 阻塞 。 一旦 
收 到 这 个 通知 ， 它 就 会 继续 执行 传输 。 

一 般 有 两 种 方法 可 以 让 进程 知道 阻塞 已 解除 。 一 种 方法 涉及 轮 询 。 当 一 个 进程 使 用 轮 询 
时 ， 它 执行 一 个 测试 原 语 来 根据 缓冲 的 状态 决定 缓冲 中 是 否 有 相关 信息 。 这 和 需要 不 停 地 检查 
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缓冲 ， 因 而 占用 CPU 的 资源 ， 这 种 行为 称 为 忙 等 待 。 然 而 许多 应 用 都 不 受 忙 等 待 的 影响 ， 
它们 并 不 是 实时 应 用 所 需要 的 。 另 外 ， 轮 询 一 般 不 在 间隔 小 于 1 分 钟 的 系统 中 使 用 ， 和 否则 会 
影响 系统 的 性 能 。 另 一 种 方法 涉及 中 断 的 使 用 。 中 断 也 可 用 于 非 阻 塞 原 语 ， 因 为 进程 不 需要 
一 直 浪 费时 间 去 检查 缓冲 ， 所 以 使 用 中 断 效率 更 高 。 

由 于 消息 传输 要 考虑 同步 ， 所 以 传送 和 接收 原 语 必须 阻塞 。 如 果 一 直 测 试 失 败 或 没有 中 
断 ， 那 么 进程 会 一 直 阻 塞 。 因 此 不 管 使 用 哪 种 方法 ， 必 须 使 用 计时 器 ， 计 时 器 可 以 使 用 默认 
值 或 由 程序 员 控制 。 在 没有 缓冲 的 实现 中 ， 每 次 执行 发 送 原 语 时 计时 器 开始 计时 ， 如 果 在 计 
时 结束 时 还 没有 得 到 内 核 的 通知 ， 则 进程 重 试 有 限 次 ， 如 图 3-1 所 示 。 在 分 布 式 环境 中 ， 通 
过 网 络 不 断 地 重 传 消息 是 不 现实 的 ， 因 此 在 分 布 式 环境 中 一 般 都 至 少 有 一 个 单一 缓冲 。 详 细 
说 明 3.1 描述 了 图 3-2 中 使 用 缓冲 的 阻塞 发 送 和 阻塞 接收 。 


进程 人 EPA B 
Send (b, masago) 
Ma: : 
ye . 
| 计时 结束 > 


Send (b, mesage) 《第 一 次 尝试 ) 
BLE 


a 
计时 结束 


Send (b, mesa) 《第 三 次 尝试 》 
这 里 接收 


| | Receive a message) 


Send (b, message) A 的 内 核 


图 3-1 阻塞 发 送 和 接收 原 语 : 无 缓冲 


进程 B 





阻塞 消息 






Receive (a, message) 
解除 阻 举 






图 3-2 带 缓冲 的 阻塞 发 送 和 接收 愿 语 
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3.2.2 非 阻塞 原 语 


大 多 数 人 都 会 认为 停止 其 他 一 切 生产 活动 而 坐 在 电话 旁 等 电话 的 效率 很 低 ， 进 程 也 不 希 
望 阻塞 和 阻止 并 发 ， 因 此 同步 有 时 不 必要 也 不 需要 。 当 非 阻 塞 原 语 执行 发 送 和 接收 时 ， 控 制 
权 立 即 返 回 给 进程 并 继 绷 执行 语句 。 然 后 ， 收 到 响应 而 产生 了 一 个 中 断 ， 通 知 进程 可 以 完成 
原 语 。 因 为 这 种 方法 不 提供 任何 形式 的 同步 ， 所 以 非 阻塞 原 语 也 称 为 异步 原 语 。 

类 似 阻 塞 原 语 ， 发 送 进 程 通常 可 以 通过 消息 或 中 断 重用 缓冲 ， 这 有 助 于 缓解 发 送 者 在 发 
送 之 前 就 重 写 消息 而 带 来 的 问题 。 由 于 进程 使 用 非 阻 塞 原 语 时 ， 原 来 使 用 阻塞 原 语 的 进程 在 
阻塞 的 时 候 可 以 从 事 其 他 工作 或 执行 语句 ， 所 以 它 在 实时 应 用 中 非常 受 欢迎 。 


3.2.3 进程 地 址 


消息 传输 系统 中 的 编 址 分 为 两 类 : 一 对 一 通信 编 址 和 组 编 址 。 

一 对 一 编 址 

一 对 一 编 址 可 以 是 显 式 的 ， 也 可 以 是 隐 式 的 。 显 式 编 址 需要 在 通信 的 进程 中 显 式 地 命名 
参数 ， 如 图 3-3 所 示 。 隐 汇编 址 则 只 需 把 服务 名 称 作 为 参数 包含 在 发 送 消息 中 而 不 是 具体 的 进 
程 ， 如 图 3-4 所 示 。 因 此 , 任何 (只 有 一 个 ) C/S 关系 中 的 服务 器 都 会 对 通信 消息 作出 响应 。 
隐 式 编 址 的 send MEERA send_ any 命令 。 类 似 地 ， 在 receive 原 语 中 的 隐 式 编 址 说 明 
服务 器 准备 与 任何 客户 机 通信 ， 隐 式 编 址 的 receive 原 语 也 称 为 receive_any 命令 。 

组 编 址 

组 编 址 是 为 支持 组 通信 而 设计 的 ， 在 并 行 和 分 布 式 系统 中 很 有 用 。 组 通信 可 以 分 为 
=; 


#3 Hes 4] 













on 
Send (P, MSG) 








Client's for Service A 


图 34 进程 间 通 信 的 隐 式 编 址 图 3-5 一 对 多 组 编 址 


4 一 对 多 。 在 这 种 情况 下 ， 有 多 个 接收 者 ， 但 只 有 一 个 发 送 者 。 因 而 使 用 这 种 编 址 类 型 
的 通信 也 称 为 组 播 通 信 。 如 果 所 有 的 接收 首都 在 网 络 上 ， 并 且 网 络 上 所 有 的 成 员 都 是 
接收 者 ， 那 么 它 也 可 以 称 为 广播 通信 。 与 一 对 一 的 隐 式 编 址 不 同 ， 所 有 接收 组 的 成 员 
都 收 到 消息 。 这 种 类 型 的 编 址 有 很 多 应 用 ， 包 括 定位 一 个 可 用 的 服务 器 或 通知 某 一 接 
收 组 一 个 问题 。 图 3-5 是 一 对 多 的 组 编 址 。 

4 多 对 一 。 在 这 种 情况 下 ， 有 多 个 发 送 者 ,但 只 有 一 个 接收 者 。 与 一 对 一 隐 式 编 址 相 类 
似 ,惟一 的 接收 者 可 以 从 一 组 中 的 一 个 发 送 者 那里 接收 消息 ， 也 可 以 从 一 组 的 几 个 或 
所 有 的 成 员 那 里 接收 消息 。 

9 多 对 多 。 在 这 种 情况 下 ， 有 多 个 接收 者 ， 也 有 多 个 发 送 者 。 这 种 类 型 编 址 的 最 大 困难 
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是 进行 消息 排序 ， 见 详细 说 明 3.2。 





详细 说 明 3.2 
多 对 多 消息 排序 











3.3 管道 


管道 是 最 早 的 、 最 原始 的 进程 间 通 信 机 制 。 它 允许 两 个 进程 通过 由 内 核 提 供 的 有 限 缓冲 
进行 通信 ， 如 图 3-7 所 示 。 通 信用 的 数据 按 先 进 先 出 (FIFO) 次 序 进 行 存 储 。 这 种 通信 原 语 
由 系统 调用 实现 。 管 道 提供 一 对 一 通信 ， 并 且 只 在 通信 的 过 程 中 存在 。 传 统 的 UNIX™ 管 道 
是 单 向 的 ， 但 现在 的 版 本 中 是 全 双 工 或 双向 的 。 当 缓存 写 满 时 引起 的 进程 阻塞 的 管道 认为 是 
同步 的 。 它 有 两 种 类 型 : 非 命名 管道 和 命名 管道 。 





BIS BAM 43 








3-1 ”使 用 管道 的 进程 间 通 信 


3.3.1 非 命名 管道 


非 命名 管道 允许 两 个 相关 的 进程 ， 比 如 由 fork 操作 产生 的 进程 进行 相互 通信 。 相 关 的 进 
程 包括 父 / 子 和 兄弟 进程 。 在 UNIX 中 ， 这 种 管道 可 以 使 用 系统 调用 pipe 或 在 命令 行使 用 竖 
AL (1) 如 lslmore 来 产生 。 管 道 在 Windows 环境 中 也 很 普遍 。 


3.3.2 命名 管道 


命名 管道 允许 不 相关 的 进程 进行 通信 。 即 使 进程 间 不 需要 相关 ， 这 些 进 程 也 需要 共享 共 
同 的 文件 系统 。 因 为 命名 管道 使 用 共享 的 数据 结构 ， 所 以 必须 在 临界 区 内 访问 缓冲 ， 详 见 第 
5 章 。 详 细 说 明 3.3 讲解 了 如 何在 UNIX 环境 中 使 用 命名 管道 。 
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用 户 可 以 使 用 UNIX 的 命令 或 chmod 改变 访问 权限 。 众 所 周知 ，UNIX 系统 中 管道 是 FIFO 
&, mknod 命令 经 常 要 求 超级 用 户 权限 ， 但 UNIX 系统 中 芭 烽 一 个 叫 mkfifo HC BRK | 
来 辅助 产生 命名 管道 并 水 要 求 这 各 权限 ，1UcEifo 的 函 教头 如 下 : | 
int mkfifo (const dhar- * path, mode_t mode); 
NPOSIX. 1 Spee 1170 
I 
path 是 创 建 的 命名 管道 的 路 径 名 ， mode 规定 用 户 、 组 和 其 他 访问 所 创建 的 管道 的 
RR, PRUNE, BAEZ, SMH 1, 
REREBRAB AOE AA AAP RRS RE, 
#inelude <¢sys/stat h>» < 
#include <sys/types.h> 
mode t fifo perms n — i | 
SIROUSR | S_IWUSR | $ IRGRP | sitROTH; 
if {mkfifo("MYPIPE", fifò perme) we -1) 
; perror ("Couldn't create MYPIPE"); 








H 建立 了 名 称 为 MYPIPE 的 命名 管理 





3.4 BRS 


为 达到 不 同 域 的 进程 间 通 信 ， 或 者 不 共享 数据 结构 或 文件 的 系统 通过 网 络 的 通信 ， 就 必 
须 使 用 传输 服务 的 一 种 机 制 ， 最 广泛 使 用 的 机 制 是 僚 接 字 。 所 有 的 套 接 字 都 由 传输 服务 管 
理 ， 每 个 套 接 字 有 两 个 通信 的 端点 ， 每 个 端点 属于 通信 进程 中 的 一 个 。 每 个 套 接 字 有 一 个 局 
部 的 端点 地 址 和 一 个 全 局 的 端点 地 址 。 局 部 地 址 指 传输 服务 中 的 地 址 ， 而 全 局 地 址 是 指 网 络 
主机 地 址 ， 这 两 个 地 直道 过 系统 调用 绑 定 在 一 起 。 这 两 个 地 址 都 是 必需 的 ， 除 非 在 通信 之 前 
已 放置 一 个 连接 套 接 字 调 用 。 这 个 调用 可 以 把 局 部 地 址 与 远程 全 局 地 址 绑 定 ， 从 而 简化 了 将 
来 的 通信 。 两 个 端点 都 必须 执行 绑 定 ， 一 个 套 搂 字 在 使 用 它 的 每 个 进程 死亡 或 一 个 进程 关闭 
它 之 前 都 是 存在 的 。 在 安全 套 接 字 层 (SL) 上 的 信息 提供 了 安全 套 接 字 的 实现 ， 详 见 
第 11 章 。 

使 用 一 个 套 接 字 一 般 需 要 6 步 ， 如 图 3-8 所 示 。 这 一 点 在 附录 中 使 用 套 接 字 的 外 科 手 术 
调度 程序 中 也 有 所 体现 。 现 在 以 电话 作为 类 比 来 讨论 一 下 每 一 步 的 情况 。 第 -一步 ， 创 建 一 个 
套 接 字 。 这 类 似 于 安装 一 个 电话 插座 ， 就 像 在 使 用 电话 前 必须 有 电话 插座 一 样 ， 在 使 用 套 接 
字 进 行 通信 前 必须 创建 一 个 套 接 字 。 第 二 步 ， 把 套 接 字 绑 定 在 端口 上 。 这 类 似 于 从 电话 公司 
获得 一 个 与 电话 插座 相关 联 的 电话 号 码 ， 只 有 把 套 接 字 绑 定 在 一 个 地 址 上 或 把 电话 号 码 绑 定 
在 电话 插座 上 才 可 以 进行 通信 。 第 三 步 ， 侦 听 电 话 铃声 或 侦 听 套 接 字 等 待 他 人 来 进行 通信 。 
一 旦 意识 到 有 人 试图 进行 联系 ， 就 可 以 接受 通信 。 第 四 步 ， 如 电话 具有 了 呼叫 等 待 特 征 一 样 ， 
套 接 字 可 以 决定 接受 多 少 个 呼叫 。 第 五 步 是 通信 。 这 时 可 以 开始 进行 通信 ， 对 套 接 字 来 说 是 
通过 读 写 命令 来 实现 。 第 六 步 是 在 通信 完成 后 断 开 连 接 或 挂 上 电话 。 

套 接 字 有 两 种 基本 的 域 类 型 。 一 种 是 流 套 接 字 (在 TCP 中 实现 )， 用 于 高 可 靠 性 的 面 
向 连接 的 通信 。 另 一 种 是 数据 报 (在 UDP/P 中 实现 )， 用 于 不 可 靠 的 非 连接 通信 。 由 于 数据 
报 不 需要 额外 负担 来 保证 可 靠 性 ， 所 以 这 种 类 型 更 有 效 ， 对 实时 应 用 很 有 吸引 力 。Windows 
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B-D: ERRET 
RIEMER? 











Eae 
进程 1 : 


第 二 步 ; RE 
进程 1 


电话 公司 





回答 电话 


gv 


BAS: 断 开 连接 


RT i A 





图 3-8” 套 接 字 的 类 比 


环境 中 套 接 字 的 实现 使 用 了 Winsock, TE SEF UNIX 的 BSD 实现 方法 ， 详 见 3.4.1 节 。3.4.,2 
节 详 细 讨 论 了 使 用 Java 实现 套 接 字 。 


3.4.1 UNIX 套 接 字 
最 早 的 UNIX 套 接 字 接口 起 源 于 1981 年 的 BSD UNIX 3.1。 用 户 必须 使 用 -lsocket 选项 
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来 编译 程序 和 使 用 UNIX 套 接 字 库 。 在 C 库 中 有 UNK 的 套 接 字 原 语 ， 包 括 socket, bind, 
connect, listen, send, receive 和 shutdown. UNIX 中 允许 两 种 类 型 的 套 接 字 ，UNIX 
套 接 字 和 Internet ERF., 接口 如 下 : 


SOCKET 

#include <sys/types.h> 

#include <sys/socket.h> 

int socket (int domain, int type, int protocol); 


域 参数 在 UNIX 域 中 的 值 为 AF_UNIX， 在 Intemet 域 中 的 值 为 AF_ INET。UNIX 域 说 明 双 
方 进程 必须 在 单个 UNK 系统 中 。 类 型 参数 在 使 用 流 的 面向 连接 的 可 靠 通信 中 取 值 SOCK _ 
STREAM， 在 使 用 数据 报 的 非 连接 不 可 靠 通信 中 取 值 SOCK_ DGRAM。 流 一 般 在 TCP 中 实现 ， 
而 数据 报 则 在 UDP 中 。 通 常 ， 对 于 某 一 特定 类 型 只 有 一 种 协议 ， 因 而 一 般 协 议 值 为 其 默认 
值 0。 


BIND 
#irclude <sys/types.h> 
#include <sys/socket .h> 
int bind(int s, const struct sockaddr *address, size_t address len); 


参数 s 是 调用 套 接 字 函 数 的 返回 值 ， 是 一 个 文件 描述 符 ' address_ len 是 * address 
structure 的 字 节 数 ， 包 括 地 址 类 别 和 协议 信息 。 当 使 用 Intemet 域 时 ， 用 于 struct 
sockaddr 的 sockaddr 的 定义 如 下 : 


struct sockaddre in 


{ 


short sin_family; 
u_short sin_port; 

struct in_addr sin_addr; 
char sin_zero[8]; 


}; 


在 Internet RP, sin_ family BRHBSERT BA HRA}, E AF_ INET, WH 
值 存储 于 变量 sin port 中 。 如 果 允 许 同 任何 主机 通信 ，sin addr 应 设置 为 INADDR_ 
ANY。 为 了 使 结构 的 大 小 与 sockaddr 相同 ， 就 用 sin_ zero 填充 。 

当 使 用 UNIX SREY, sockaddr 使 用 如 下 的 定义 : 


Struct sockaddr 


{ 


short sun_family; 
char sun_path[]; 


}; 


在 UNIX RF, sun_ family 参数 应 像 在 套 接 字 函 数 中 一 样 定 义 为 AF_ UNIX，UNIX 的 
路 径 名 赋 给 字段 sun_ path, 


LISTEN 
#include <sys/types.h> 
#include<sys/socket .h> 
int listen(int s, int backlog size); 
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”此 函数 只 用 于 建立 基于 连接 的 套 接 字 。 同 样 ，s 是 调用 套 接 字 函 数 的 返回 值 。 字 段 backlog 


_ size 允许 用 户 限制 一 个 连接 被 拒绝 之 前 所 能 等 待 的 客户 端 连接 请 求 数 ， 这 样 可 以 允许 一 
个 服务 器 处 理 多 个 通信 请 求 。 


ACCEPT 
#include <sys/types.h> 
#include <sys/socket .h> 


int accept (int s, struct sockaddr *address, int *address_len); 


我 们 注意 到 这 些 参 数 和 bind 函数 非常 相似 ， 除 了 * address 包含 进行 连接 的 客户 端 信 
息 。 所 以 在 Intemet 域 中 ，accept 中 的 * address_ len 指明 了 呼叫 前 的 缓冲 区 的 大 小 以 及 
呼叫 后 填充 到 组 冲 区 中 的 信息 的 大 小 。 返 回 值 是 一 个 用 于 和 客户 端 通信 的 文件 描述 符 。 


GETHOSTBYADDR 

#include <sys/types.h> 

#include <sys/socket .h> 

struct hostent *gethostbyaddr (const void *addr, size_t len, int 
type); 


该 函数 用 于 将 accept 函数 中 收 到 的 地 址 转换 成 名 字 ， 因 此 非常 有 用 。 


SEND 
#include <sys/types.h> 
#include <sys/socket .h> 
int send(int s, const char* buf, int len, int flag); 


buf PREWA len 个 字 节 的 消息 发 送 到 一 个 由 s 指定 的 套 接 字 中 。 


RECV 
#include <sys/types.h> 
#include <sys/socket .h> 
int recv(int s, char* buf, int len, int flag); 


同样 ， 一 条 信息 由 套 接 字 s 接收 并 拷贝 到 buf 中 。 接 收 信息 的 最 大 长 度 由 len 指定 。 
所 有 的 消息 是 以 FIFO (先进 先 出 ) 的 次 序 接 收 。 如 果 设 置 了 标志 ， 那么 表明 接收 不 按照 此 
次 序 (被 分 行 ) 的 带宽 外 (out-of-band) 数据 。 这 种 消息 应 只 用 于 紧急 情况 。 


CLOSE 
#include <sys/types.h> 
#include <sys/socket .h> 
int close({int s); 


该 函数 用 于 关闭 一 个 套 接 字 s。 

最 后 ， 由 于 所 有 系统 均 有 细微 的 差异 。 我 们 可 能 必须 在 发 送 之 前 转换 数据 的 格式 ， 万 
其 是 某 些 机 器 使 用 ASCI 格式 而 另外 一 些 机 器 使 用 EBCDIC 格式 。 这 些 机 器 也 使 用 不 同 的 字 
节 顺 序 。 下 面 是 一 些 可 用 的 转换 函数 。 


htons (): 主机 字 节 顺序 转 成 短 整 型 的 网 络 字 节 顺序 。 
ntohs (): 网 络 字 节 顺序 转 成 短 整 型 的 主机 字 节 顺序 。 
htoni (): 主机 字 节 顺序 转 成 整 型 的 网 络 字 节 顺 序 。 
ntohi (): 网 络 字 节 顺 序 转 成 整 型 的 主机 字 节 顺序 。 
ntonl (): 主机 字 节 顺序 转 成 长 整 型 的 网 络 字 节 顺序 。 
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ntohl (): 网 络 字 节 顺序 转 成 长 整 型 的 主机 字 节 顺序 。 
3.4.2 Java 对 套 接 字 的 支持 


Java 提供 了 两 个 类 支持 Intemet BHF. java.net.Socket 是 客户 端 使 用 的 类 ， 而 ja- 
va.net.ServerSocket 是 客户 端 使 用 的 类 ， 这 是 使 用 套 接 字 编程 最 简单 的 方法 。 客 户 端的 
类 见 详细 说 明 3,4。 
详细 说 明 3.4 

SAM Java RR 
‘public final class Socket extende Object { 


/ 公共 构造 函数 
“ 

















“public Socket (String host, int port) : 
-throws UnknownHostkxception, IORxception: 
H PARRA eae 
public Socket (string host, int Port, oo 
: boolean strean) throws “NOException 
# 使 用 主机 名 和 非 默认 的 数据 报 
public Socket (InetAddress address, int pert) oe 
. : ‘throws Omeept ton, os ; 
A 7 “使 用 下 地 址 和 默认 的 数据 流 
public ane ee address, int port, T F 
， ‘boolean Jthrows 10Exception; _ 








a5 eol 全 用 P ARARA 
We 

ak de 

il 









- - at laplrastory 
tacithrow omxception, (gocher eonpt ion; 


We 


public synchronized void closet) 
: throws TOExeception; : 
- publie InetAddreas gee Inetnddrene () 
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使 用 这 个 类 ， 客 户 端 首 先 通过 构建 一 个 套 接 字 的 方法 与 服务 器 建立 一 个 连接 ， 这 种 情况 
下 ， 用 户 必须 指定 服务 器 的 主机 名 和 端口 号 。 这 个 类 的 默认 方式 是 使 用 流 套 接 字 ， 当 然 也 可 
以 指定 使 用 数据 报 。 

以 下 代码 段 试图 与 主机 rose. myuniversity.edu 的 端口 25 连接 一 个 套 接 字 。 当 然 如 注解 所 
AR, 可 以 根据 情况 把 主机 名 替换 成 真实 的 IP 地 址 ， 这 样 可 以 与 没有 静态 IP 地 址 的 伙伴 
通信 。 

Try {Socket sock = rew Socket 


("rose.myuniversity.edu'", 25); 


} 


catch (UnknownHostException e) 


{ 


System. s.ut.printin("Unable to locate host."); 


} 


catch (IOException e) 


{ 


System.out ._printin("Host Ccnnection Error."); 


} 


如 果 连 接 成 功 完成 ， 用 户 可 以 通过 如 下 语句 ; 
Socket getInputStream () & Socket getOutputStream () 


检索 输入 和 输出 流 来 发 送 和 接收 信息 。 
当 客 户 端 建立 连接 之 后 ， 服 务 器 端 可 以 使 用 详细 说 明 3,5 中 定义 的 Java 服务 器 套 接 字 类 
与 客户 端 进行 通信 。 








. Clase ServerSocket extends object { 









7 公关 实例 方法 


= publie Socket. t sxe throws TORM¢eption; 
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ServerSocket 使 用 方法 accept 在 一 定 的 时 间 范 围 内 连接 到 指定 的 端口 建立 侦 听 ， 
端口 号 应 大 于 1024， 因 为 标准 的 、 众 所 周知 的 ， 以 及 系统 的 进程 使 用 较 小 数目 的 端口 号 。 
然后 服务 器 使 用 getInputstream 和 getOutputStream 发 送 和 接收 数据 一旦 创建 了 
ServerSocket ， 服 务 器 套 接 字 可 以 接受 很 多 连接 。 

3.5 远程 过 程 调 用 

许多 计算 机 科学 家 习惯 于 使 用 过 程 的 方式 进行 编程 。 远 程 过 程 调用 (Remote procedure 
call, RPC) 允许 进程 使 用 简单 的 (熟悉 的 ) 过 程 调用 ， 通 过 网 络 与 远程 进程 通信 。 从 前 面 
介绍 的 进程 间 通 信 技 术 可 以 看 出 ， 在 通信 进程 之 间 只 有 简单 的 消息 传输 。 像 许多 流行 语言 
过 程 一 样 ，RPC 不 仅 允 许 程序 员 通过 发 送 消息 进 行 通信 ， 还 允许 更 复杂 的 数据 结构 作为 参数 
值 和 返回 值 。 调 用 者 在 等 待 返回 值 时 被 阻塞 ， 所 以 RPC 以 并 行为 代价 提供 同步 ， 如 同 阻 塞 
的 消息 传递 原 语 一 样 。 因 为 RPC 的 调用 函数 等 待 的 不 仅仅 是 一 个 确认 ， 还 包括 返回 值 ， 所 
以 调用 函数 等 待 的 时 间 较 长 。 我 们 现在 来 讨论 远程 过 程 调 用 实现 中 的 各 种 问题 (3.5.1 节 到 
3.5.6 47). 3.5.7 节 将 讨论 在 SUN 的 ONC RPC 中 是 如 何 处 理 的 。 


3.5.1 参数 类 型 


同 本 地 过 程 调用 一 样 ， 参 数 类 型 在 远程 过 程 调用 中 相当 重要 ， 因 为 它 将 影响 到 你 对 最 后 
结果 的 期 望 。 远 程 过 程 调用 有 三 种 基本 的 参数 类 型 ; 

$ 只 输入 : 这 种 类 型 的 参数 只 能 把 信息 传送 给 服务 器 端 ， 类 似 于 传 值 调用 。 

4 只 给 出 : 这 种 类 型 的 参数 只 能 把 信息 从 服务 器 端 传送 给 客户 端 ， 客 户 端 不 能 利用 这 个 

参数 把 信息 传送 给 服务 器 端 。 

4 输入 和 输出 : 这 种 类 型 的 参数 能 把 信息 传送 给 服务 器 端 ， 服 务 器 端 也 能 使 用 同一 个 参 

数 类 型 把 信息 传 回 给 客户 端 ， 一 般 使 用 传 值 /结果 调用 (call-by-value/result) 实现 。 


3.5.2 数据 类 型 支持 


数据 类 型 支持 与 远程 过 程 调用 中 使 用 的 参数 的 数据 类 型 相关 。 和 许多 编程 语言 限制 参数 
的 复杂 性 一 样 ，RPC 也 对 其 作 了 限制 。 通 常 RPC 限制 参数 的 数目 ， 而 允许 更 复杂 的 数据 类 
型 ， 比 如 限制 只 使 用 一 个 参数 ， 但 允许 复杂 的 结构 ， 这 样 对 程序 员 不 会 有 太 大 的 不 便 。 


3.5.3 参数 整理 


为 了 有 效 地 进行 通信 ， 参 数 和 更 大 的 数据 结构 必须 使 用 RPC 整理 。 整 理 (Marshalling) 
是 指 把 信息 以 紧凑 的 方式 打包 从 而 使 网 络 上 传输 的 信息 量 最 少 。 打 包 的 方法 必须 精确 ， 这 样 
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接收 者 才能 够 正确 地 解 开 信息 。 整 理 在 每 次 发 生 RPC 函数 调用 时 ， 由 所 调用 的 桩 函数 执行 ， 
如 图 3-9 所 示 。 桩 的 使 用 需要 库 的 扩展 ， 不 仅 减轻 了 程序 员 的 负担 ， 还 有 助 于 透明 性 的 实现 
(透明 性 问题 将 在 第 8 章 讨论 )。 有 些 RPC 实现 提供 了 更 多 的 必要 的 桩 函数 【NIST93a]。 在 实 
际 中 ，RPC 用 于 隐藏 所 使 用 为 底层 进程 间 通 信 的 方法 ， 如 套 接 字 ( 详 见 3.4 节 )。 


客户 BEB 





Remote fo(a,b,c) Remote foo(a, b,c) 





1 5 | 返回 信息 


3-9 ”远程 过 程 调用 桩 函数 


3.5.4 RPC 绑 定 


在 使 用 远程 过 程 调用 之 前， 客户 和 服务 器 必须 建立 通信 。 类 似 于 套 接 字 ， 在 客户 向 服务 
器 发 送 RPC 之 前 ， 服 务 器 必须 存在 且 已 登记 。 登 记 是 向 内 核 的 端口 管理 者 申请 一 个 端口 
《如 果 不 知 道 服务 器 ， 则 必须 与 目录 服务 器 〈 详 见 第 8 章 ) 连接 )。 这 样 服务 器 端 可 以 确定 侦 [73 | 
听 哪 一 个 端口 来 与 客户 端 通信 ， 客 户 端 则 必须 与 端口 管理 者 联系 并 接收 访问 服务 器 的 句柄 ， 
如 图 3-10 所 示 。 这 个 句柄 用 来 处 理 底层 套 接 字 绑 定 。 本 过 程 就 是 绑 定 并 且 发 生 于 如 下 三 个 
不 同 的 时 刻 ， 它 对 程序 员 和 用 户 是 透明 的 。， 








客户 端 
L 我 需要 一 个 端口 。 
2 这 是 你 的 端口 。 
3 我 需要 一 个 句柄 。 
5 按 名 柄 通信 。 


图 3-10 建立 RPC 通信 
4 编译 时 : 需要 知道 服务 器 的 地 址 且 被 编译 成 客户 的 代码 。 这 昌 不 是 最 灵活 的 方法 ， 但 


对 静态 的 应 用 程序 配置 来 讲 很 方便 。 
4 链接 时 ; 客户 端 在 申请 服务 之 前 请 求 句 柄 。 这 种 情况 下 ， 将 把 句柄 放 人 客户 端的 高 速 


a] 
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缓存 以 备 将 来 的 请 求 。 

4 运行 时 ; 从 建立 第 一 个 调用 开始 ， 客 户 与 服务 器 绑 定 。 服 务 器 发 回 句柄 以 及 其 他 RPC 

返回 值 。 

警告 ， 只 要 服务 器 在 运行 ， 提 供给 客户 的 句柄 就 一 直 有 效 。 如 果 服 务 器 有 几 个 客户 并 且 
只 想 取消 一 个 客户 的 特权 ， 那 么 它 必须 退出 并 获取 一 个 新 的 端口 ， 这 个 新 端口 必须 重新 与 余 
下 有 效 的 客户 进行 绑 定 ， 再 提供 给 它们 一 个 新 的 句柄 。 总 之 ， 服 务 器 不 可 以 拒绝 一 个 具有 有 
效 句 柄 的 客户 的 访问 。 


3.5.5 RPC 认证 


在 分 布 式 系 统 中 ， 容 户 会 希望 验证 所 使 用 的 服务 器 的 身份 。 同 样 服务 器 也 希望 验证 客户 
的 身份 。 从 账户 中 取 钱 的 真是 Alice 吗 ? 分布 式 认证 和 数字 签名 的 更 多 信息 详 见 第 11 章 。 


3.5.6 RPC 调用 语义 


调用 语义 决定 重复 过 程 调用 会 发 生 什 么 。 由 于 网 络 出 错 会 使 返回 值 或 者 初始 的 过 程 调用 
委 失 ， 也 有 可 能 破坏 或 迁 迟 时 间 太 长 ， 导 致 调用 的 过 程 认 为 调用 已 经 丢失 。 这 样 ， 过 程 调用 
就 会 重复 。 看 起 来 没什么 ， 但 如 果 过 程 调用 是 从 你 的 银行 账户 中 取 $300 呢 ? 重复 调用 ， 如 
果 系 统 记 录 你 多 取 了 $300 (但 不 给 你 钱 !)， 你 肯定 会 不 高 兴 。 语 义 实现 的 精确 性 决定 于 系 
统 使 用 的 是 有 状态 的 还 是 无 状态 的 服务 器 。 有 状态 的 服务 器 在 一 张 表 中 保存 了 客户 的 状态 信 
息 ， 所 以 随后 的 调用 利用 先前 调用 的 信息 而 不 重 传 重 要 的 信息 ， 这 也 减少 了 网 络 的 负载 和 总 
的 传输 时 间 ， 从 而 加 快 了 处 理 请 求 的 速度 。 然 而 如 果 服 务 器 月 演 并 且 信 息 丢 失 ， 客 户 却 无 法 
知道 。 有 些 语义 在 有 状态 的 服务 器 上 容易 实现 ， 另 外 一 些 则 容易 在 无 状态 的 服务 器 上 实现 。 

以 下 是 4 种 流行 的 RPC 调用 语义 : 

最 多 一 次 . 

最 多 一 次 语义 经 常 在 有 状态 的 服务 器 上 实现 ， 它 要 求 确保 重复 请 求 同 一 个 RPC 时 将 不 
再 被 服务 器 处 理 。 服 务 器 通常 会 检查 它 的 状态 信息 表 来 准 别 重复 的 过 程 调用 。 

最 少 一 次 

最 少 一 次 语义 确保 远程 过 程 调用 至 少 执行 一 次 ， 有 可 能 是 多 次 。 这 个 语义 不 指明 或 保证 
哪 一 个 过 程 凋 用 将 返回 值 ， 但 保证 将 返回 一 些 值 。 

多 次 调用 的 最 后 一 次 

多 次 调用 的 最 后 一 次 语义 要 求 每 一 个 远程 过 程 调用 的 请 求 都 包含 一 个 标识 符 ， 客 户 只 接 
受 最 近 一 次 请 求 的 返回 值 。 

RF 

eS RA FARA MARAIS A RPC 应 用 。 昌 然 远 程 过 程 调 用 能 执行 多 次 ， 和 但 
保证 结果 中 没有 非 预期 的 效果 。 对 于 有 状态 服务 器 来 说 ， 这 意味 着 客户 的 多 次 请 求 不 能 破坏 
服务 器 的 状态 。 


3.5.7 SUN 的 ONC RPC 


RPC 的 第 一 个 商业 实现 是 SUN™ 的 开放 式 网 络 计算 (Open Network Computing, ONC), 
RPC， 最 早 经 常 被 称 为 SUN RPC。 最 初 的 实现 高 度 依赖 San0S， 就 是 现在 著名 的 Solaris™ BEE 
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系统 的 前 身 。ONC 也 有 一 个 独立 传输 RPC (Transport Independent RPC, TI RPC) ， 可 用 于 不 同 
的 传输 层 协 议和 更 完全 的 C/S EK, 

ONC RPC 同时 支持 最 多 一 次 和 寡 等 调用 语义 。 此 外 它 还 提供 对 广播 RPC (多 个 接收 者 ) 、 
无 应 答 或 批 处 理 RPC 的 支持 。 批 处 理 RPC 不 需要 返回 值 ， 一 般 用 于 更 新 日 志 。 由 于 ONC 只 
允许 两 个 参数 : 一 个 输入 参数 和 一 个 输出 参数 。 在 参数 类 型 实现 方面 看 ，ONC 是 有 限制 的 ， 
但 是 它 支 持 几 乎 所 有 的 C 语言 中 的 数量 和 集合 数据 类 型 ， 因 而 用 户 可 以 把 需要 的 参数 组 合 
成 结构 并 把 它 传送 给 远程 过 程 。ONC RPC 提供 三 个 层次 的 身份 验证 ， 使 用 数据 加 密 标 准 
(Data Encryption Standard, DES) 的 最 高 层 称 为 安全 RPC，DES 详 见 第 11 章 。 


3.6 小 结 


进程 间 通 信 是 多 进程 完成 同一 任务 中 的 一 个 关键 问题 ， 程 序 员 可 以 使 用 各 种 技术 。 表 3- 
1 根据 分 布 式 系统 中 能 使 用 的 高 级 部 件 的 类 型 总 结 了 本 章 所 描述 的 方法 。 第 12 章 的 案例 学 
习 会 更 进一步 地 讨论 进程 问 通信。 当 使 用 进程 间 通 信 时 ， 用 户 必 须知 道 每 一 种 方法 的 优 缺 
点 。 消 息 传输 可 以 以 阻塞 或 非 阻塞 的 方式 用 于 分 布 式 或 并 行 系统 中 。 管 道 使 用 缓冲 ， 也 提供 
同步 ， 只 要 进程 能 共享 目录 空间 就 可 使 用 ， 但 程序 员 必 须 意 识 到 这 会 约束 应 用 的 扩展 和 应 用 
的 规模 。 通 常 为 避免 管道 的 这 种 严厉 的 限制 ， 最 好 使 用 套 接 字 。 从 套 接 字 为 程序 员 提 供 的 控 
制 水 平 上 来 看 ， 它 可 能 是 功能 最 强大 的 进程 间 通 信 机 制 了 ， 但 这 些 增 加 的 控制 也 带 来 了 许多 
处 理 附 加 细节 的 麻烦 。 除 非 用 户 富有 经 验 并 能 熟练 开发 ， 否 则 套 接 字 还 是 很 麻烦 的 。 在 详细 
说 明 3.4 和 3.5 中 ，Java 通过 类 定义 对 套 接 字 的 支持 给 予 了 许多 允诺 ， 但 只 有 时 间 才 能 证 明 
这 人 一点。 远程 过 程 调用 在 分 布 式 系统 中 很 有 用 ， 但 因为 缺少 桩 函数 支持 ， 所 以 需要 程序 员 去 
实现 桩 函数 [NIST93a]。 我 们 还 要 记得 在 RPC 下 层 通 常会 发 现 我 们 的 朋友 一 一 套 接 字 。 为 提 
高 这 个 多 进程 间 计 算 的 关键 方面 的 能 力 ， 在 该 领域 的 研究 和 发 展 仍 在 继续 。 


RZ IPC 机 制 总 结 及 其 在 分 布 式 系 统 组 件 中 的 应 用 
PC 方法 分 布 式 部 件 实时 部 件 并 行 部 件 








消息 传输 是 是 是 

eit a 是 是 

套 接 字 是 l 是 是 

RPC 是 * 是 是 
3.7 参考 文献 
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下 面 提 供 的 是 一 些 关于 进程 间 通 信和 同步 内 容 在 Intemet 上 的 资源 ，Winsock2 的 信息 在 
http: // www.intel.com/ial/winsock2，1.1 版 本 的 Windows Socket 的 常见 问题 (FAQ) 在 fip: // 
SunSite. UNC. EDU/pub/micro/pe-stuff/ms-windows/winsock/FAQ. —~*4 i Winsock FAQ 的 网 址 
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是 http: //www. well. com/user. nac/alt-winsock-faq. html, [ NIST93a] 的 在 线 版 本 在 http: // 
nemo. nesl. nist. gov/nistir/$277/. http: //ei.cs.vt.edu/ ~ cs5204/rpe/rfe1057.html 是 [Sun88] 的 在 
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本 。 


3.1 
3.2 
3.3 
3.4 
3.5 
3.6 
3.7 


3.8 


3.9 


就 3.1 节 给 出 的 选择 因素 〈 不 包括 第 一 个 因素 ) 评价 本 章 中 的 IPC 机 制 。 
描述 一 个 应 用 人 情景， 在 这 个 情 最 中 ， 程 序 需要 同步 通信 。 

描述 如 何 使 用 非 阻 塞 原 语 模拟 阻塞 消息 传送 。 

描述 如 何 使 用 阻塞 原 语 模拟 非 阻塞 消息 传送 。 

描述 一 个 应 用 情景 ， 在 这 个 情景 中 ， 程 序 需要 异步 通信 。 

描述 阻塞 相对 于 非 阻塞 消息 传送 的 优 缺 点 。 

分 别 描述 以 下 消息 传送 编 址 类 别 的 一 个 用 途 ， 

a. 一 对 一 编 直 - 

b. 一 对 多 编 址 

c. BR — Fad: 

d. 多 对 多 编 址 

分 别 描述 一 个 方案 来 实现 以 下 消息 传送 编 址 ， 

a. 一 对 一 编 址 

b. 一 对 多 编 址 

c. 多 对 一 编 址 

d. 多 对 多 编 址 

描述 一 个 情景 ， 在 这 个 情景 中 多 对 多 消息 传送 的 随机 排序 会 产生 问题 。 


3.10 写 一 个 客户 端 和 服务 器 端 共享 UNIX 命名 管道 的 程序 。 客 户 端 程序 接受 用 户 的 输 


人 并 写 人 命名 管道 ， 服 务 器 端 程序 从 命名 管道 中 读 取信 息 并 显示 在 屏幕 上 。 


3.11 讨论 套 接 字 和 管道 间 的 相对 优 缺 点 。 
3.12 Blackjack 是 一 个 流行 的 纸牌 游戏 ， 一 副 纸牌 包括 52 张 ， 有 4 组 : 红心 、 方 块 、 


黑 桃 、 梅 花 。 每 组 有 一 张 A、1、2、3、4、5、6、7、8、9、10、J、Q 和 K。 上 本 
Q 和 被 认为 是 花 牌 点数 按 如 下 的 方式 规定 : 

花 牌 : 10 点， 

A 到 10: 分 别 是 1 到 10 点 。 

发 牌 人 先 给 每 一 位 游戏 者 一 张 牌 ， 然 后 再 给 第 二 张 ， 接 着 游戏 者 可 以 决定 是 否 再 
要 牌 ， 除 非 a. 要 求 停止 , 或 b. 总 数 超过 ?21 点 ， 否 则 游戏 者 可 以 任意 要 牌 。 
考虑 只 有 一 个 发 牌 人 ， 游 戏 者 最 多 只 有 5 个。 为 简化 起 见 ， 我 们 只 允许 A 等 于 1 
点 ， 不 允许 发 牌 人 参与 游戏 。 

按 以 下 的 规则 决定 赢 者 : 

a. 第 一 位 不 超过 但 达到 21 点 的 游戏 者 。 

b. 不 超过 但 最 接近 21 点 的 游戏 者 。 

c. 不 超过 但 最 接近 21 点 的 点 数 相 同 的 一 组 游戏 者 。 

游戏 者 可 以 允许 玩 多 次 ， 但 每 次 都 重新 洗 牌 〈 提 示 : 使 用 随机 数字 产生 器 )， 游 
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3.13 
3.14 
3.15 


戏 者 在 加 入 一 个 新 游戏 时 有 了 时间 限 制 ， 

选项 1: 使 用 命名 管道 实现 游戏 。 

选项 2: 使 用 UNIX 套 接 字 实 现 游戏 。 

选项 3: 使 用 Intemet 数据 报 套 接 字 实现 游戏 。 

选项 4， 使 用 nemet 流 套 接 字 实现 游戏 。 

选项 $， 实 现 选 项 3 和 选项 4。 

一 个 轻 量 级 的 REC 允许 在 同一 主机 系统 中 进行 RPC 调用 ， DRRR: 点 。 

描述 一 个 得 益 于 非 阻 塞 RPC 的 应 用 。 

ONC RPC 只 人 允许 有 两 个 参数 : 一 个 输入 参数 和 一 个 输出 参数 ， 其 潜在 的 优点 是 
什么 ? 
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B46 内 存 管 理 


正如 第 2 章 中 所 提 型 的， 内 存 管 理 通常 是 内 核 职 足 的 一 部 分 。 在 所 有 系统 中 它 都 是 一 个 
关键 因素 ， 因 为 所 有 执行 的 程序 及 其 数据 都 需要 驻 留 在 内 存 。 内 存 管理 往往 不 仅 依 赖 于 操作 
系统 ， 而 且 依 赖 于 底层 的 机 器 结构 。 该 领域 的 一 些 最 新 研究 涉及 如 何 将 内 存 管理 从 计算 机 架 
构 中 分 离 出 来 。 

在 本 章 中 ，4.1 节 首 先 简 要 回顾 一 下 有 关 和 集中 式 内 存 管 理 。 若 需要 进一步 了 解 相关 知 
识 ， 请 参阅 你 喜欢 的 有 关 操 作 系 统 的 入门 书籍 ， 然 后 我 们 进一步 讨论 高 级 操作 系统 中 的 内 存 
管理 。 内 存 分 为 几 部 分 ; BERF, EE (随机 存储 器 ，RAM) 和 辅 存 。 辅 存 通 常 在 磁带 、 
硬 /软盘 驱动 器 、CD-ROM 或 DVD 上 实现 。 高 速 缓存 〈 包 括 闪 存 ) BRR (也 是 最 贵 ) 的 内 
存 ， 但 是 它 是 易 失 性 的 ， 存 储 在 里 面 的 数据 不 允许 掉 电 。 直 接 配 在 CPU 上 的 高 速 缓存 比 通 
过 总 线 (通常 在 主板 上 ) 连接 的 高 速 缓存 要 人 快 。 主 存 是 第 二 快速 的 内 存 ， 也 是 易 失 性 的 。 辅 
存 速 度 较 慢 且 便宜 ， 但 它 是 非 易 失 性 的 。 搜 索 、 访 问 和 传输 速度 极 大 地 依赖 于 存储 的 种 类 ， 
并 在 不 断 提高 。 

一 个 具有 单一 存储 室 间 的 并 行 计 算 机 将 利用 4.2 节 中 提出 的 简单 的 存储 模型 。4.3 节 描 
述 的 使 用 NUMA 结构 的 共享 内 存 模型 也 常常 被 采用 ， 小 规模 的 分 布 式 系统 也 采用 这 种 模型 。 
另外 ， 分 布 式 系统 可 能 利用 的 扩展 虚拟 存储 和 分 布 式 共享 内 存 模型 将 在 4.4 节 讨 论 。 最 后 在 
4.5 节 中 讨论 分 布 式 存储 管理 中 尤其 重要 的 存储 迁移 的 实现 问题 。 


4.1 集中 式 内 存 管理 回顾 


为 了 理解 高 级 操作 系统 ， 有 必要 了 人 解 一 下 集中 式 内 存 管理 。 具 体 地 说 ， 分 布 式 系 统 中 分 
布 式 内 存 管理 器 驻 留 在 集中 式 内 存 管 理 器 顶端 是 很 常见 的 。 真 实 内 存 指 实际 的 物理 主 存 ， 大 
多 数 集中 式 系 统 不 仅 使 用 物理 主 存 ， 还 提供 虚拟 内 存 。 本 节 首 先 简要 回顾 一 下 虚拟 内 存 
(4.1.17), RAB (4.1.2 节 )、 页 面 替换 算法 (4.1.3 节 ) 的 基本 概念 。 


4.1.1 虚拟 内 存 


虚拟 内 存在 现代 的 集中 式 系统 中 很 普遍 ， 它 使 进程 能 访问 的 内 存 超过 实际 可 用 的 数量 
(不 论 是 对 系统 还 是 进程 )。 不 在 主 存 上 的 虚拟 内 存 位 于 磁盘 内 ， 内 存 管理 器 在 系统 的 虚拟 地 
址 空间 范围 内 为 进程 提供 虚拟 地 址 ， 并 负责 管理 虚拟 内 存 的 哪 部 分 位 于 物理 内 存 ， 哪 部 分 位 于 磁 
盘 。 虚 拟 内 存 到 物理 内 存 或 磁盘 的 映射 由 内 存 管理 单元 (memory management unit, MMU) 实现 。 


4.1.2 页 面 和 段 


为 移动 和 编 址 的 方便 ， 内 存 经 常 被 分 成 段 或 页 面 。 段 根据 数据 的 大 小 而 有 所 改变 ， 但 总 
是 为 最 接近 的 2 的 整数 乱 。 页 面 的 大 小 一 般 相同 ， 内 存 的 页 面 在 物理 内 存 中 放置 成 像 页 面 一 
样 大 小 相同 的 帧 。 浪 费 的 内 存 空 间 有 两 种 ; 内 部 碎片 和 外 部 碎片 。 内 部 碎片 是 一 个 内 存 块 
中 浪费 的 空间 ， 而 外 部 障 片 是 主 存 中 不 同 数据 块 之 间 所 浪费 的 空间 。 对 于 一 个 系统 来 说 有 
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B. 分 段 


Gus 


















ERAT) 
CJ WR 
外 部 碎片 
图 4-1 基于 分 页 的 内 存 和 基于 分 段 的 内 存 中 的 碎片 
B. KANA 
需要 存放 的 段 
D. 最 差 匹配 


S 
Lp 
= 





图 4-2 选择 段 存放 位 置 的 算法 
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30% 的 内 存 由 碎片 所 浪费 是 司空 见 惯 的 。 图 4-1 显示 了 基于 分 页 的 内 存 和 基于 分 段 的 内 存 的 
内 部 和 外 部 碎片 。 

内 存 段 深 受 外 部 碎片 和 偶尔 少量 的 内 部 碎片 影响 。 外 部 碎片 是 内 存 中 段 的 移 人 移出 操作 
所 造成 的 。 初 始 的 段 可 能 被 分 成 适当 的 大 小 并 且 紧 密 排 列 ， 当 一 个 段 移出 物理 内 存 ， 新 移 人 
的 段 不 是 同样 大 小 的 概率 非常 高 ， 这 就 会 在 段 与 段 之 间 产生 “空洞 "。 随 着 动态 地 连续 不 断 
地 将 自称 人 移出 物理 内 存 ， 就 会 导致 许多 空洞 的 存在 。 

这 些 空洞 就 是 外 部 碎片 。 选 择 一 个 空洞 用 来 存放 一 个 段 的 通常 算法 是 首次 匹配 、 最 佳 匹 
配 和 最 差 匹配 。 首 次 匹配 是 将 段 放 在 它 发 现 的 第 一 个 可 行 的 洞 中 ， 最 佳 匹 配 是 将 段 放 在 一 个 
尽 可 能 小 的 洞 中 ， 最 善 匹 配 是 将 段 放 在 尽 可 能 大 且 足 以 容纳 该 段 的 洞 中 。 这 些 算 法 在 图 4-2 
中 进行 了 描述 。 

因为 所 有 的 页 大 小 相同 ,但 一 个 进程 所 需 的 内 存 可 能 是 变化 的 ， 所 以 分 页 会 受 内 部 碎片 
影响 。 然 而 统一 的 页 面 大 小 消除 了 外 部 碎片 。 当 一 个 页 面 从 物理 内 存 中 移 走 时 ， 所 留 下 的 
“空洞 ”刚好 是 另 一 个 页 的 大 小 。 页 面 通 常用 在 虚拟 内 存 系统 中 ， 用 来 管理 页 面 信息 的 数据 
结构 是 一 张 分 页 表 。 这 张 表 存放 着 不 同 页 面 的 虚拟 地 址 (尤其 是 一 个 虚拟 页 面 号 和 页 内 偏 移 
量 )。 虚 拟 页 面 号 是 分 页 琴 中 一 个 简单 的 索引 。 


4.1.3 页 替换 算法 


当 一 个 进程 需要 一 个 没有 驻 留 在 物理 内 存 中 的 页 面 时 会 产生 一 个 页 面 错 误 。 页 面 蔡 换 算 
法 是 用 来 决定 物理 内 存 中 鄂 个 页 面 将 被 替换 出 去 ， 用 来 存放 所 需要 的 新 的 页 面 。 这 个 蔡 换 算 
法 可 能 适用 于 整个 系统 的 物理 内 存 ， 分 配给 导致 页 面 错误 的 同一 用 户 的 内 存 或 导致 页 面 错误 
的 进程 的 物理 内 存 。 因 移动 页 面 需要 耗费 资源 ， 所 以 这 是 一 个 重要 的 决策 ， 页 面 蔡 换算 法 的 
首要 目标 就 是 做 出 正确 的 选择 。 理 想 的 正确 选择 就 是 任何 选中 替换 的 页 面 不 再 使 用 ; 而 最 坏 
的 选择 是 选中 替换 的 页 面 即 将 被 访问 ， 这 会 导致 另 一 个 页 面 错误 ! 如 果 系 统 仍然 不 断 地 读 取 
和 再 读 取 某 页 面 将 导致 系统 性 能 受到 严重 影响 ， 这 就 是 颠 敏 〈thrashing)。 一 方面 颠 壬 是 糟糕 
的 页 面 替换 算法 的 结果 ， 通 党 也 是 多 道 程 序 设计 程度 相对 于 可 利用 资源 太 高 而 造成 的 。 如 果 
系统 要 减少 多 道 程序 的 道 数 ， 将 会 减少 需要 服务 的 进程 的 数目 。 反 之 ， 会 增加 每 个 进程 可 用 
的 物理 内 存 及 减少 页 面 错误 的 数目 。 糟 糕 的 编程 技术 也 会 导致 不 必要 的 页 面 错误 比如， 以 
列 为 主 序 访 问 数组 ， 但 编程 存储 时 却 以 行为 主 序 )。 

第 一 个 页 面 蔡 换 算法 是 先进 先 出 FIFO)。 在 这 个 算法 中 ,根据 页 面 开 始 进 入 内 存 的 时 
间 进 行 替 换 。 当 发 生 页 面 错 误 且 没有 可 用 的 帧 的 时 候 ， 最 先进 人 内 存 的 页 面 将 最 先 被 移出 。 
这 个 算法 的 缺点 是 最 先 移 人 的 页 面 通常 也 是 最 重要 的 页 面 ， 会 被 频繁 地 调用 ， 很 可 能 马上 就 
要 再 次 被 调用 。 第 二 个 页 面 蔡 换 算法 是 非 最 近 使 用 (NRLU)。 这 个 算法 是 放弃 最 近 不 被 使 用 
的 页 面 。 最 近 可 以 是 静态 阅 值 ， 可 以 使 几 个 页 面具 有 同等 的 放弃 候选 资格 。 第 三 个 页 面 蔡 换 
算法 类 似 于 NRU， 是 最 近 最 少 使 用 。 这 个 算法 移出 最 长 时 间 不 被 访问 的 页 面 ， 认 为 是 不 再 
需要 。 设 想 一 个 装 满 了 衣服 的 衣柜 ， 不 能 再 儿 装 一 件 ， 如 果 买 了 一 件 新 外 套 想 把 它 放 和信 衣 
柜 ， 最 大 的 可 能 选择 就 是 拿 走 一 两 年 都 不 曾 穿 过 的 衣服 ， 而 不 是 拿 走 上 周 刚 穿 过 的 外 套 。 这 
是 这 个 算法 的 基础 ， 这 也 是 一 个 流行 的 算法 。 这 个 算法 的 衔 变 有 第 二 次 机 会 算法 。 第 二 次 机 
会 算法 在 页 面 被 选择 移出 的 时 候 第 一 次 对 其 进行 标记 ， 除 非 页 面 已 经 被 标记 过 ， 和 否则 不 移 
出 。 当 一 个 内 存 页 面 被 访问 时 则 清除 标记 〈 如 果 有 标记 )， 页 面 替 换算 法 则 继续 寻找 符合 标 
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准 及 标记 过 的 页 面 。 其 他 算法 会 考虑 到 移出 页 面 的 费用 。 这 种 类 型 的 “懒惰 ”算法 努力 去 寻 
找 不 需要 重新 写 回 磁盘 的 页 面 ， 并 通过 跟踪 含有 被 改写 过 数据 的 页 面 〈 胜 页 面 ) REM. P 
掉 一 个 干净 的 页 面 总 比 扔 掉 一 个 及 页 面 来 得 快 。 


4.2 简单 内 存 模型 


简单 内 存 模型 用 于 并 行 UMA 系统 的 内 存 管理 。 在 这 个 简单 内 存 模 型 中 ， 所 有 处 理 器 的 
访问 次 数 都 是 相等 的 ， 因 此 所 关心 的 主要 问题 是 全 局 内 存 的 并 行程 度 。 我 们 讲 过 集中 式 系统 
中 多 道 程序 程度 太 高 时 ,没有 一 个 单独 的 任务 有 足够 的 内 存 空 间 来 执行 。 所 以 每 个 任务 不 断 
地 调用 没有 载 和 内 存 的 页 面 ， 并 产生 其 艇 这 会 导致 很 大 的 开销 。 同 样 ， 并 行 系统 必须 提供 
给 处 理 器 足够 的 内 存 。 当 然 ， 在 经 济 上 可 行 的 上 时候， 大 量 内 存 解 决 方案 更 具有 了 吸引 力 ， 可 以 
利用 不 太 昂 贵 的 内 存 。 

高 性 能 并 行 系统 经 常 选择 不 使 用 虚拟 内 存 和 高 速 缓存 。 虚 拟 内 存 需 要 额外 的 管理 负担 ， 
这 些 负担 会 减低 以 最 佳 性 能 为 设计 和 需求 目标 的 系统 的 性 能 。 鉴 于 高 性 能 系统 中 实现 程序 的 
类 型 需 计算 的 数据 量 很 大 ， 这 样 需要 大 量 的 高 速 缓存 。 另 外 ， 因 为 这 些 数 据 通常 不 会 重用 ， 
高 速 缓存 的 优点 越发 减弱 ， 所 以 高 速 缓存 也 变 得 越发 不 实用 了 。 


4.3 共享 内 存 模 型 


当 在 一 个 小 的 分 布 式 或 多 处 理 器 (NUMA) 环境 中 计算 时 ， 就 会 用 到 消息 传输 模型 或 共 
享 内 存 模型 。 像 第 3 章 所 担 到 的 那样 ， 共 享 内 存 模型 是 为 完成 进程 间 通信 的 附加 模型 。 实 际 
上 ， 共 享 内 存 因 其 能 快速 完成 任务 (如 在 调制 解 调 器 和 拨号 路 由 器 的 网 络 接口 之 间 传 递 消 
息 ) 而 成 为 最 流行 的 方法 。 共 享 内 存 模 型 把 虚拟 内 存 的 概念 扩展 到 多 物理 内 存 、 本 地 的 高 速 
缓存 和 辅 存 。 共 享 内 存 模型 在 使 用 消息 传输 (或 远程 过 程 调用 ) 时 会 遇 到 困难 ， 因 其 不 是 使 
用 大 而 复杂 的 数据 集合 的 有 效 的 方法 。 共 享 内 存 相对 消息 传输 的 最 大 优点 是 容易 数据 分 割 及 
通过 迁移 执行 载 和 分发。 共享 内 存 模型 允许 多 个 进程 读 、 写 其 公共 内 存 中 的 数据 结构 ， 这 样 
系统 必须 引入 一 些 并 发 控制 (LESH) 和 事务 管理 ( 见 第 9 章 )。 共 享 内 存 模型 的 另外 一 
个 优点 是 共享 同一 内 存 的 含有 本 地 高 速 缓存 的 工作 站 的 使 用 ， 这 些 工 作 站 再 通过 总 线 连 接 来 
形成 共同 的 共享 内 存 。 这 方面 对 于 多 处 理 器 和 本 地 分 布 式 系统 非常 有 用 ， 因 为 它 在 保证 经 济 
负担 最 小 的 情况 下 ， 大 幅度 地 提高 了 性 能 和 计算 能 力 。 但 也 面临 这 样 的 困难 ， 芭 通过 单一 总 
线 不 断 地 访问 内 存 ， 也 就 是 说 ， 工 作 站 会 经 常 面临 总 线 争夺 而 导致 瓶颈 ， 所 以 一 般 不 建议 在 
单一 总 线 上 使 用 超过 32 个 处 理 器 的 时 候 使 用 这 种 方法 。 详 细 说 明 4.1 描述 了 Amoeba 内 存 管 
理 系统 ， 详 细 说明 4.2 则 描述 支持 共享 内 存 的 UNIX 系统 Vo 
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位置 ， 而 且 必 须 全 部 位 于 虚拟 内 存 中 ， 否 则 就 不 能 使 用 Amoeba Be 
系统 中 的 各 种 进程 共享， 但 不 能 通过 网 络 共 享 。 











ER 








4.3.1 共享 内 存 性 能 


随 着 处 理 器 速度 的 不 断 提 高 ， 内 存 的 瓶颈 日 益 严 重 ， 系 统 在 等 待 从 内 存 中 检索 信息 的 时 
候 花 费 了 几乎 所 有 的 空闲 时 间 。 系 统 通常 标榜 它们 的 性 能 ， 但 这 个 性 能 是 指 性 能 的 峰值 ， 而 
不 是 平均 性 能 。 一 些 阻止 完全 利用 快速 处 理 器 和 许多 现 有 资源 的 最 大 的 问题 就 是 内 存 速度 、 
内 存 访问 和 通信 延迟 ， 这 些 同 样 存在 于 共享 内 存 系统 中 。 使 用 共享 内 存 的 一 个 最 基本 的 问题 
是 规模 一 一 如 果 处 理 器 的 数目 和 内 存 的 数量 增加 了 ， 系 统 如 何 更 好 地 保证 它 的 高 效 性 能 。 当 
增加 并 行 或 分 布 式 系统 的 内 存 和 处 理 能 力 时 ， 可 能 会 认为 人 性 能 也 在 线性 增加 。 不 幸 的 是 ， 有 
句 老话 “厨师 多 了 煮 坏 汤 ” 在 这 里 呈现 全 新 的 含义 。 通 常 ， 不 在 于 有 厨师 数目 的 多 少 ， 而 在 
于 他 们 之 间 的 协调 和 利用 ! 

性 能 对 所 有 的 应 用 都 很 重要 ， 尤 其 是 对 于 实时 应 用 。 通 常 超级 计算 机 和 实时 应 用 不 使 用 
任何 类 型 的 虚拟 内 存 ， 正 如 俗话 所 说 “如 果 不 是 真实 的 《意思 是 虚拟 的 )， 那 么 也 就 不 是 快 
速 的 ”。 对 于 实时 要 求 不 太 严格 的 应 用 ，Sun 和 Zhu 提出 了 两 个 能 提高 共享 虚拟 内 存 性 能 的 
因素 [SuZh96]。 首 先 ， 系统 应 该 让 通信 与 计算 交 彼 ， 一 个 不 允许 交合 的 系统 在 效率 方面 不 
可 能 同 提供 通信 和 计算 交 秋 的 系统 一 样 高 。 其 次 ， 系 统 应 该 尽 可 能 地 自动 预 读 取 数 据 。 如 果 
读 取 远 程 数据 的 指令 能 够 在 系统 需要 内 存 中 的 数据 的 前 一 步 执行 ， 那 么 至 少 可 以 减少 等 待 远 
程 数据 的 延迟 或 使 延迟 最 小 。 软 件 开发 技术 允许 提前 辨别 这 些 信 息 ， 这 个 辨别 过 程 可 以 在 运 
行 时 间或 接近 运行 时 间 由 编译 器 自动 执行 。 

另外 还 有 两 个 因素 可 能 会 影响 共享 内 存 系统 的 性 能 。 首 先 回忆 在 NUMA 构架 〈 根 据 定 
X) 中 ， 非 本 地 内 存 引 用 比 本 地 的 内 存 引 用 要 昂贵 得 多 。 另 外 按照 惯例 ， 非 本 地 内 存 引 用 与 
本 地 的 内 存 引 用 费用 比例 可 高 达 10:1， 所 以 可 以 通过 监视 非 本 地 内 存 引用 来 提高 性 能 。 当 
达到 某 一 阐 值 时 ， 就 使 用 算法 把 这 一 页 迁移 到 本 地 内 存 中 去 。 这 个 任务 一 般 由 一 个 叫 页 扫描 
器 的 系统 守护 进程 执行 ， 它 会 监视 适当 的 统计 数据 并 迁移 页 面 。 如 果 系 统 是 一 个 同类 系统 ， 
迁移 仅 作为 页 面 错误 处 理 ，4.5 节 将 讨论 迁移 的 相关 问题 。 
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4.3.2 高 速 缓存 一 致 性 


如 果 必 须要 预 读 取 数据 ， 那 么 共享 内 存 成 功 A B 
实现 的 一 个 重要 因素 就 是 高 速 缓存 应 保持 一 臻 | 
性 。 一 致 性 是 用 于 找 述 确保 所 有 复制 数据 相同 并 
且 正 确 的 功能 术语 ， 有 三 种 实现 高 速 缓存 一 致 性 一 FT = 
的 方法 。 第 一 种 是 利用 软件 加 强 临 界 区 ， 即 菜 一 BAE X 内 的 值 并 在 兽 线 上 传送 。 





BUS 


给 定 进 程 将 改变 共享 数据 HF 所 处 的 受 保护 的 代码 ^ 


区 域 ， 将 在 第 $ 章 详细 讨论 。 第 二 种 是 利用 软件 A B 
阻止 处 理 器 把 共享 内 存 作为 高 速 缓存 。 第 三 种 方 | 
法 是 指 窃听 式 高 速 缓存 ， 如 图 4-3 所 示 。 在 第 三 
种 方法 中 ， 所 有 的 处 理 器 都 通过 共享 总 线 相连 ， 





每 一 个 处 理 器 不 断 地 窃听 或 监视 共享 总 线 。 如 果 AAG LR B BRT X A 
并 将 X 标记 为 胜 的 ， 


某 一 个 处 理 器 探测 到 总 线 上 的 信息 将 要 改变 本 地 
已 缓存 的 数据 ， 那 么 就 把 含 缓存 数据 的 那 一 块 标 
记 为 “ 脏 的 ";， 如 果 处 理 器 要 访问 及 的 高 速 缓存 ， 
它 必须 从 共享 内 存 系统 中 请 求 一 个 干净 的 副本 。 
窃听 式 高 速 缓存 确实 很 大 程度 地 减少 了 总 线 流 7 eine im 
量 ， 但 对 增加 系统 处 理 器 的 最 大 数目 却 没有 什么 。 如 果 和 需要 访问 X， 它 将 请 求 ， 个 干净 的 刚 本 
帮助 。 各 种 窃听 式 高 速 缓存 在 使 用 多 总 线 的 系统 ， RN TPP ARE A 

中 也 有 应 用 ， 只 是 算法 比 保持 高 速 缓存 一 致 性 的 
进程 更 复杂 。 关 于 各 种 类 型 的 数据 一 致 性 的 内 容 
将 在 第 9 章 论述 。 


4.4 分 布 式 共享 内 存 


分 布 式 共享 内 存 模 型 最 先是 由 Li 和 Hudak 在 1980 年 引入 的 [LiHu89]， 并 且 从 那 时 起 在 
处 理 上 引起 了 广泛 的 讨论 。 一 个 使 用 分 布 式 共 至 内 存 (DSM) 的 系统 ， 通 常 认为 是 多 计算 机 
系统 ， 由 具有 本 地 内 存 的 独立 的 处 理 器 组 成 。 这 些 处 理 器 通过 互连网 络 相 联 ， 这 一 点 在 第 1 
章 中 已 有 讨论 。 消 息 传 输 和 分 布 式 共享 内 存 主 劲 的 区 别 是 DSM 给 出 了 共享 内 存 的 逻辑 视图 ， 
因而 对 应 用 来 说 ，DSM 系统 实现 了 必要 的 通信 并 保持 了 应 用 程序 中 数据 的 一 致 性 。 像 共享 
内 存 模 型 一 样 ， 在 DSM 中 多 数 是 为 了 提高 效率 而 保留 了 本 地 的 高 速 缓存 ， 本 地 内 存 的 部 分 
或 全 部 都 映射 到 DSM 全 局 地 址 空间 中 。DSM 系统 为 驻 留 在 系统 中 的 所 有 数据 维护 一 个 目录 
服务 ， 用 来 存储 完整 的 状态 和 位 置信 息 。 有 多 种 实现 这 种 目录 服务 的 模型 ， 但 使 用 的 方法 应 
由 系统 需要 的 一 致 性 类 型 决定 ( 详 见 第 8 章 的 分 布 式 目录 和 第 9 章 中 有 关 各 种 类 型 一 致 性 模 
型 的 讨论 )。 无 论 实际 的 内 部 目录 是 如 何 实现 能 ，DSM 系统 都 通过 利用 单个 目录 或 几 个 分 布 
式 目 录 来 维护 完整 的 信息 。 


4.4.1 分 布 式 共 享 数据 的 方法 
为 了 管理 共享 数据 ， 必 须 做 好 下 面 的 决策 ， 





e 


图 43 窃听 式 高 速 缓存 
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4 共享 数据 如 何 分 布 ? 

4 一 个 给 定数 据 集 允许 多 少 读者 和 写 者 ? 

有 两 种 方法 分 布 共享 数据 ; 复制 和 迁移 。 复 制 会 保留 多 个 副本 ， 每 一 个 需要 数据 的 地 方 
都 有 自己 的 本 地 副本 。 迁 移 则 把 数据 的 副本 移动 到 需要 它 的 不 同 的 位 置 。 使 用 迁移 只 有 一 个 
地 方 允 许 有 副本 ， 如 果 另 一 个 位 置 需要 使 用 这 些 数据 ， 除 非 当 前 的 数据 持 有 者 放弃 ， 否 则 任 
何 请 求 都 不 予以 满足 。 寻 果 DSM 系统 收 到 多 个 请 求 ， 它 就 根据 请 求 的 顺序 或 优先 级 来 决定 
哪个 请 求 得 到 批准 。 

管理 共享 数据 还 涉及 到 决定 允许 并 发 访 后 某 一 数据 集 的 读者 和 写 者 的 数目 。 人 允许 多 写 者 
的 系统 比 把 写 者 数量 限制 为 一 个 的 系统 要 复杂 得 多 。 以 下 介绍 三 种 方法 : 单 读 者 / 单 写 者 、 
多 读者 / 单 写 者 和 多 读者 /多 写 者 。 

单 读者 / 单 写 者 

顾名思义 ， 这 种 类 型 的 方法 对 某 一 特定 数据 集 只 允许 一 个 读者 和 一 个 写 者 ， 因 而 禁止 并 
发 使 用 共享 信息 且 不 允许 复制 。 解 决 方案 可 以 是 集中 式 的 也 可 以 是 分 布 式 的 。 使 用 集中 式 解 
决 方案 ，DSM 系统 需要 一 个 集中 式 的 服务 器 ， 洪 在 的 瓶颈 将 会 是 一 个 关键 问题 。 分 布 式 解 
决 方案 一 般 需 要 一 个 静态 的 数据 分 布 ， 因 而 需要 一 个 进程 联系 两 个 不 同 的 地 方 以 获取 不 同 的 
数据 集合 ， 但 是 同一 个 数据 集合 通常 由 同一 个 位 置 控制 。 如 果 分 布 式 的 解决 方案 不 允许 迁 
移 ， 那 么 某 一 给 定数 据 集合 不 仅 由 同一 位 置 控制 ， 而 且 还 要 一 直 位 于 这 个 位 置 。 人 允许 迁移 的 
单 读者 / 单 写 者 分 布 式 DSM 算法 也 称 为 “ 热 士 豆 ” 算 法 [KeLi891。 

多 读者 / 单 写 者 

顾名思义 ， 这 种 类 型 的 方法 允许 多 读者 但 集中 式 服务 器 
只 允许 写 人 一 个 惟一 的 位 置 。 当 多 读者 都 拥有 
一 个 数据 集合 的 副本 且 单 一 的 写 者 改变 了 这 个 
数据 ， 那 么 读者 的 副本 就 不 再 准确 。 为 了 避免 
这 种 情况 ， 大 多 数 实现 都 对 拥有 只 读 副 本 的 位 
置 给 出 无 效 处 理 。 这 种 无 效 处 理 需 要 一 个 副本 

合 ， 即 系统 中 拥有 每 一 份 数 据 副 本 的 成 员 的 
列表 。 多 读者 / 单 写 者 方法 可 以 由 集中 式 的 解决 
方案 、 集 中 式 和 分 布 式 解决 方案 的 组 合 或 分 布 
式 解决 方案 来 实现 。 

集中 式 解决 方案 需要 一 个 服务 器 (关键 元 
素 ) 处 理 所 有 的 请 求 并 维护 所 有 的 数据 ， 同 时 
也 负责 发 送 所 有 的 无 效 通知 ， 如 图 4-4 所 示 。 我 
们 已 经 介绍 了 每 一 种 集中 式 的 解决 方案 ， 知 道 
它 并 不 是 最 有 效 的 解决 方案 ， 因 为 它 增 加 了 服 
务 器 周围 的 网 络 流量 ， 同 时 又 需要 服务 器 超额 图 4-4 多 读者 / 单 写 者 DSM 的 集中 式 服务 器 
工作 。 

另 一 种 可 选择 的 集中 式 解决 方案 的 方法 包含 了 部 分 分 布 状态 。 具 体 地 说 ， 集 中 式 服务 器 
接收 请 求 信息 ， 所 有 的 数据 静态 地 分 布 在 整个 系统 中 。 集 中 式 服务 器 接收 到 请 求 后 就 把 信息 
传送 到 负责 某 一 特定 信息 的 分 布 位 置 ， 每 一 位 置 负责 处 理 集中 式 服务 器 转发 的 请 求 ， 并 在 数 
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据 无 效 时 通知 读者 ， 图 45 描述 了 这 种 实现 中 
的 一 个 无 效 的 范例 。 

对 DSM 的 多 读者 / 单 写 者 方法 来 说 有 两 
种 基本 的 分 布 式 方法 。 第 一 个 分 布 式 方法 是 
动态 的 ,信息 可 以 改变 位 置 。 为 了 定位 数据 
集合 的 拥有 者 ， 所 有 的 请 求 都 在 系统 中 进行 
广播 ， 如 图 4-6 所 示 。 

这 个 方法 增加 了 系统 中 传输 的 信息 重 ， 
因而 对 整个 分 布 式 系统 产生 了 更 多 的 额外 人 负 
担 。 详 细 说 明 4.3 给 出 了 动态 算法 。 第 二 个 
方法 是 静态 地 分 布 数据 。 数 据 的 拥有 者 (如 
持 有 特定 数据 集合 的 位 置 ) 负责 接收 和 处 理 
所 有 与 这 些 数 据 相关 的 信息 并 在 数据 无 效 时 
通知 读者 。 因 这 种 方法 涉及 静态 分 布 ， 所 以 
每 一 个 成 员 都 知道 每 一 个 数据 存储 在 什么 地 
方 。 详 细 说 明 4.4 给 出 了 静态 算法 。 这 种 解 


集中 式 服务 器 成 员 1 





45 多 读者 / 单 写 者 DSM 部 分 分 布 的 无 效 方案 





图 46 动态 分 布 式 多 读者 / 单 写 者 DSM 


图 47 多 读者 / 单 写 者 DM 的 动态 数据 分 配 


决 方案 的 一 个 变通 之 处 是 允许 动态 地 分 配 数据 ， 把 请 求 传送 给 数据 的 可 能 拥有 者 或 最 后 拥有 
者 。 如 果 是 真正 的 拥有 者 ， 那 么 问题 就 解决 了 ; 如果 数 据 已 重新 分 配 过 ， 请 求 的 接收 者 就 会 
把 请 求 转发 给 它 认 为 的 数据 持 有 者 ， 如 图 4-7 所 示 。 详 细 说 明 4.5 描述 了 Chorus 中 的 DSM 


系统 。 
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return (Fage ‘Nunber, “read write status) ; 


1/ 当 满足 单个 写 者 的 条 件 ， re 
ROR BRA oe 


If read write. atatusewrite 


If 如 a | 


Then wriveinage R Mumbar) sde 
H I 


~ o Hise ma te ec 














多 读者 /多 写 者 

为 了 更 好 地 理解 DSM 中 多 读者 /多 写 者 方法 的 复杂 性 ， 设 想 自己 是 一 个 项 目 组 中 的 一 
员 。 如 果 每 个 人 用 磁盘 把 程序 的 副本 带 回 家 ， 并 独自 修改 ， 那 么 如 何 自动 地 整合 每 一 个 人 的 
修改 ? 这 也 就 是 这 种 类 型 的 DSM 所 面临 的 问题 。 解 决 方案 需要 一 个 序列 器 负责 给 所 有 的 读 
请 求 和 写 请 求 按时 间 排 序 ， 分 布 式 环境 中 的 时 间 排 序 算法 将 在 第 10 章 中 介绍 。 序 列 器 接收 
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到 请 求 并 附加 上 序列 信息 后 ， 请 求 就 广播 到 拥有 数据 集合 副本 的 站 点 ， 广 播 的 接收 者 根据 序 
列 器 标识 的 顺序 更 新 自己 的 数据 副本 集 。 序 列 器 算法 可 以 是 集中 式 的 或 分 布 式 的 ， 多 读者 / 
多 写 者 DSM 算法 也 称 为 全 复制 算法 。 


4.4.2 DSM 性 能 问题 


对 于 所 有 的 系统 ， 每 个 人 都 希望 高 效率 地 实现 。 这 一 点 我 们 也 一 直 提 到 ， 实 时 系统 的 效 
率 不 仅 是 所 要 求 的 ， 而 且 是 必需 的 。 具 体 地 说 ， 主 要 是 要 考虑 颠 壬 、 数 据 共享 、 块 大 小 的 选 
择 和 DSM 系统 的 实现 位 置 等 问题 。 

我 们 回顾 术语 颠 黎 ， 即 在 更 标准 的 操作 系统 中 多 道 程序 设计 程度 太 高 以 致 系统 被 迫 不 断 
地 改变 内 存 中 的 页 面 ， 因 而 降低 了 性 能 。 在 分 布 式 操作 系统 中 ,许多 位 置 都 希望 改变 共同 的 
数据 集合 时 ， 凑 艇 是 指 DSM。 这 就 导致 数据 集合 不 断 地 在 各 个 位 置 间 传输 ， 就 像 在 网 络 上 
为 控制 数据 集合 而 进行 拔河 一 样 。 如 果 数 据 集合 在 某 一 位 置 反 复 传 输 ， 就 不 能 对 这 些 数 据 继 
续 进 行 操作 ,性 能 也 就 随 之 下 降 ， 其 艇 则 更 加 严重 。 如 果 “ 拔 河 ” 中 涉及 一 个 页 面 ， 但 在 这 
个 页 面 中 不 含有 共享 数据 结构 ， 则 称 之 为 伪 共 享 。 苏 复 的 一 个 解决 方案 是 保证 每 一 位 置 都 会 
在 一 个 最 小 持续 时 间 量 的 过 程 中 持 有 数据 集合 ， 这 称 为 暂时 停顿 页 面 。 

颠 艇 的 最 佳 解 决 方 窒 是 将 适当 大 小 的 块 用 于 数据 迁移 。 如 果 块 太 大 ， 多 位 置 请 求 同 一 个 
数据 块 的 可 能 性 会 增加 。 尺 寸 大 的 块 还 会 导致 本 应 单独 存放 的 两 个 或 更 多 个 不 相关 数据 存放 
在 同一 块 中 ， 这 样 又 增加 了 多 个 位 置 请 求 同 一 块 的 可 能 性 。 当 然 ， 如 果 块 太 小 ， 则 服务 器 会 
有 更 多 的 块 ， 那 么 目录 服务 器 管理 数据 的 费用 必定 增加 ， 状 态 信息 表 的 条 目 也 会 增多 。 因 每 
个 数据 块 必须 单独 请 求 并 传送 到 要 求 的 位 置 ， 所 以 大 的 块 减少 了 费用 量 。 | 

随 之 而 来 的 问题 是 ， 从 效率 角度 来 看 多 大 的 块 为 最 好 。 一 般 最 好 的 折衷 是 在 DSM 系统 
中 使 数据 块 的 尺寸 与 底 展 系统 的 页 面 尺寸 相同 ， 这 样 允许 DSM 在 现存 的 系统 顶层 ， 利 用 相 
同 的 页 面 错误 和 访问 控制 机 制 ， 很 容易 地 进行 集成 。 这 些 具有 页 面 尺 寸 的 块 应 能 确保 某 一 给 
定位 置 在 固定 的 最 小 时 间 内 进行 计算 。 另 一 方面 ， 因 分 布 式 系统 驻 留 在 网 络 的 顶层 ， 如 果 块 
及 页 面 的 尺寸 能 与 下 面 网 络 使 用 传输 信息 的 包 的 大 小 联系 起 来 ， 无 疑 可 以 改善 性 能 。 这 个 问 
题 对 应 用 开发 者 应 该 透明 ， 但 是 如 果 忽 略 了 它 ， 分 布 式 实时 应 用 会 自行 破坏 ， 这 也 是 系统 程 
序 员 应 该 注意 的 。 | 

另外 一 个 性 能 问题 是 内 存 等 待 状态 和 谨慎 选择 数据 元 素 位 置 的 问题 。 这 个 问题 在 并 行 结 
构 的 单 内 存 模 型 中 很 容易 解决 ， 但 在 分 布 式 环境 中 不 可 忽略 。 只 要 存在 某 种 形式 的 同步 ， 就 
可 以 辨别 数据 访问 模式 ， 并 可 能 进行 优化 以 使 内 存 访 问 的 延迟 最 小 。 随 着 处 理 器 速度 的 快速 
增长 ， 实 时 应 用 中 这 个 问题 越 来 越 显著 。 关 于 这 个 主题 的 讨论 可 在 [FErCo92, FErCo93a，Fr- 
Co93b, Erick93b, GaCo95] 中 找到 。 

最 后 一 个 效率 问题 是 DSM 应 在 哪里 实现 ， 算法 可 在 硬件 中 、 软 件 中 或 二 者 结合 来 实现 。 
一 般 较 昂贵 和 复杂 的 计算 机 使 用 硬件 实现 ， 世 是 最 有 效 的 实现 。 不 太 昂 贵 的 系统 如 个 人 计算 
机 在 软件 中 实现 DBM， 而 工作 站 使 用 软 、 硬 件 结合 的 方式 来 实现 。 


4.5 内 存 迁 移 


内 存 管理 的 一 项 必要 任务 是 虚拟 内 存 移动 ， 或 叫 内 存 迁 移 。 内 存 迁 移 是 第 2 章 讨 论 的 进 
程 迁移 中 最 费时 的 部 分 。 对 于 内 存 迁 移 需要 做 两 个 基本 的 决策 : 
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4 在 进程 迁移 的 什么 时 候 迁 移 内 存 ? 
© 应 该 迁移 多 少 内 存 ? 
下 面 讨 论 实现 内 存 迁 移 的 三 个 基本 方法 。 
第 一 个 方法 是 停止 和 复制 (stop- 
and-copy)， 这 是 最 简单 最 直接 的 方法 ， 
但 同时 它 也 是 效率 最 低 的 解决 方案 。 








当 在 迁移 进程 中 使 用 这 种 内 存 迁 移 的 
时 候 ， 原始 位 置 进 程 的 执行 立即 被 持 
起 ， 然 后 与 这 个 进程 相关 的 所 有 虚拟 aaO 上 和 所 有 
内 存 转移 到 迁移 目的 地 。-- 且 与 进程 相关 信息 


有 关 的 其 他 信息 迁移 结束 ， 进 程 继续 
执行 。 这 个 方法 尤其 对 交互 和 实时 应 
用 缺乏 吸引 力 ， 这 样 的 环境 根本 不 能 
接受 彻底 中 断 进程 执行 (也 称 停顿 时 第 三 
E) [Esk89]) 直到 所 有 的 迁移 完成 所 
导致 的 无 效率 ， 以 及 转移 所 有 相关 虚 
拟 内 存 时 浪费 的 时 间 。 图 4-8 描述 了 
停止 和 复制 方法 。 

第 二 个 方法 是 并 发 复制 ， 如 图 4-9 
所 示 。 这 个 方法 试图 在 迁移 进程 中 减 
少 因 完 全 中 断 进程 执行 而 导致 的 无 效 
率 。 因 此 ， 当 要 迁移 进程 时 ， 进 程 继 
续 在 最 初 的 位 置 执行 ， 同 时 并 发 拷贝 
所 有 的 虚拟 内 存 和 其 他 与 迁移 进程 相 
关 的 信息 到 目的 地 。 随 着 进程 在 原始 
位 置 的 继续 执行 ， 一 些 已 迁移 的 页 面 
成 为 脏 的 页 面 ， 也 就 是 说 因 程 序 的 执 
行 ， 这 些 页 面 与 迁移 的 页 面 所 包含 的 
信息 已 不 相同 。 这 样 这 些 脏 页 面 不 断 
地 传输 到 目的 地 。 接 下 来 产生 的 问题 
就 是 何 时 应 该 停止 在 原始 位 置 的 执行 ， 
重新 复制 这 些 脏 的 页 面 ， 报 后 在 迁移 
地 点 完成 进程 。 中 断 进 程 执行 和 完成 
迁移 是 在 特定 的 条 件 满足 时 实现 的 ， 
决定 条 件 的 算法 可 以 根据 具体 的 脏 页 图 49 并 发 复制 内 存 迁 移 
面 与 干净 页 面 的 比值 ， 以 及 在 一 段 固 
定时 间 标 准 内 脏 页 面 的 不 变数 目 或 二 者 的 结合 。 本 方法 有 效 地 减少 了 停顿 时 间 ， 但 同 停止 和 
复制 一 样 ， 仍 在 拷贝 所 有 相关 虚拟 内 存 时 浪费 了 时 间 和 资源 。 并 发 复制 也 称 为 预 复制 ， 应 用 
于 V- 分 布 式 系 统 中 [TLCS]. 





图 48 个 止 和 复制 内 存 迁 移 
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第 三 个 方法 是 引用 时 复制 (copy-on-refer- 资源 
ence) ， 当 一 个 进程 需要 迁移 时 ， 它 就 停止 。 : 
除了 相关 的 虚拟 内 存 外 所 有 状态 信息 都 转移 
到 迁移 目的 地 ， 接 着 进程 继续 在 迁移 地 点 执 
行 ， 同 时 只 从 内 存 中 转移 进程 执行 时 需要 访 
问 的 那些 页 面 。 与 被 迁移 的 进程 有 关 的 页 面 
可 能 存放 在 最 初 的 位 置 或 已 转移 到 文件 服务 














器 。 如 果 仍 在 原始 位 置 ， 那 么 那里 的 资源 仍 | 

在 使 用 中 ， 反 之 则 被 释放 。 如 果 利 用 服务 器 ， 

所 有 的 虚拟 内 存 仍 要 在 网 络 上 转移 ， 但 不 是 
所 有 的 页 面 都 必须 迁移 到 目的 地 。 这 种 转移 第 = 步 A pomen E 
在 所 有 状态 信息 转移 到 迁移 目的 地 之 前 发 生 ， Re 





并 允许 原始 位 置 上 的 内 存 资源 立即 释放 。 最 
后 ,利用 服务 器 清除 了 原始 位 置 与 迁移 目的 
地 之 间 的 依赖 。 图 4-10 描述 了 引用 时 复制 图 4-10 引用 时 复制 内 存 迁 移 
方法 。 
4.6 小 结 

内 存 管 理 是 操作 系统 中 一 个 极其 重要 的 部 分 ， 每 一 个 进程 的 执行 和 所 有 数据 的 操作 都 
必须 驻 留 在 内 存 中 。 表 4-1 给 出 了 各 种 讨论 过 的 能 适用 于 高 级 系统 的 模型 。 实 时 系统 可 以 使 
用 给 出 的 任何 一 种 架构 形式 ， 所 以 没有 包括 在 表 中 ， 然 而 内 存 管理 为 实时 系统 提高 性 能 提供 
了 机 会 。 表 4-2 总 结 了 本 章 介绍 的 提高 系统 性 能 的 各 种 选择 。 
R41 可 用 于 高 级 系统 的 内 存 管理 选择 




















高 级 系统 组 件 类 型 
内 存 管理 模型 
并 行 UMA 行 NUMA 分 布 式 的 
简单 内 存 模 型 是 
共享 内 存 模型 是 对 小 规模 最 好 
分 布 式 共享 内 存 — 是 
R42 内存 管 理 的 性 能 选择 
方法 /概念 性 能 选择 
简单 内 存 模型 运行 好 但 需要 避免 颠 艇 
共享 内 存 模 型 通信 和 计算 交 看 
预 读 取 数据 
使 用 窃听 式 高 速 缓存 
分 布 式 共 享 内 存 多 读者 / 单 写 者 : 静态 分 布 式 算法 


多 读者 / 单 写 者 : 集中 式 算法 
多 读者 /多 写 者 (好 的 并 发 性 ) 
允许 暂时 停顿 
块 大 小 = 页 面 大 小 
硬件 实现 (至 少 是 部 分 ) 

内 存 迁 移 并 发 复制 
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有 规则 的 分 布 式 内 存 管理 ， 就 像 集中 式 系统 一 样 ， 仍 将 是 一 个 活 牙 的 研究 领域 。 正 如 我 
们 所 讨论 的 ， 大 多 数 内 存 管 理性 能 集中 在 有 限 的 为 存 空 间 内 执行 和 操作 数据 。 因 此 有 理由 相 
信 ， 随 着 技术 的 进步 和 经 济 实力 的 提高 ， 内 存 的 容量 会 增 大 ， 内 存 管 理 问 题 就 会 变 得 不 是 如 
此 关键 。 但 同时 由 于 系统 需求 的 扩大 和 程序 的 日 益 庞 大 ， 所 以 这 种 论断 也 不 完全 正确 。 要 知 
道 ， 许 多 集中 式 系统 曾经 没有 虚拟 内 存 ， 而 只 是 拥有 16K 的 RAM! 


4.7 参考 文献 


第 1 章 提供 的 参考 文献 能 提供 更 多 的 内 存 管理 信息 ， 如 [PTM98|j。 与 本 章 内 容 相关 的 
一 些 传统 的 研究 论文 可 参考 [AAO092，AGGL86，ARS89 ，BGGLOR94，ErCo92 ErCo93a, Er- 
CP3b, Erick93b, Esk89, Esk95, Fu97, GaCo95, Keli89, LaEl91, Lee97, LEK91, LiHu89, 
MoPu97, PIM96, StZh90, SuZh96 和 TLC85 ]。 

下 面 给 出 一 些 详细 说 明 中 讨论 的 两 个 系统 在 Intemet 上 的 资源 起 始 地 址 。 具 体 地 说 ， 
CHORUS 主页 为 http: //www.sun.com/chorusos/, Amoeba 网 页 的 地 址 为 http: // 
www.am.cs.vu.nl。 宾 夕 法 尼 亚 大 学 分 布 式 系 统 技术 报告 和 研究 实验 室 的 网 页 http: /ww- 
w. cis. upenn. edu/ ~ dsl/library ,html 包含 一 些 关于 在 延迟 方面 的 DSM 的 效率 方面 的 研究 论文 。 
第 1 章 的 综合 网 页 也 为 包含 内 存 管理 内 容 的 具体 文档 提供 了 链接 。 


习题 


41 就 个 人 计算 机 的 辅 存 ， 回 答 以 下 问题 。( 提 示 : 查 一 下 当前 的 商业 杂志 、 制 造 商 和 
销售 商 的 站 点 。) 

现在 有 什么 类 型 的 硬盘 驱动 器 ? 

解释 各 种 类 型 便 盘 驱动 器 的 区 别 。 

现在 各 种 类 型 重 盘 驱动 器 的 价格 分 别 是 多 少 ? 

现在 各 种 类 型 重 盘 驱动 器 的 访问 、 寻 找 和 传输 速率 是 多 少 ? 

. 现在 硬盘 驱动 磊 的 最 大 容量 是 多 少 ? 为 什么 会 有 限制 ? 

. 现在 只 读 CD-ROM 访问、 寻找 和 传输 速率 是 多 少 ? 

. 只 读 CD- ROM 与 可 读 写 CD - ROM 相 比 ， 速 率 有 什么 不 同 ? 为 什么 ? 

. 现在 CD - ROM、 可 读 写 CD- ROM 的 价格 是 多 少 ? 

. 现在 DVD 的 价格 是 多 少 ? 

4.2 ”描述 段 相 对 于 页 硬 的 一 个 优点 。 描 述 贡 面 相对 于 有 段 的 优点 。 

4.3 使 用 更 大 尺寸 页 面 的 优 缺 点 是 什么 ? 使 用 更 小 尺寸 页 面 的 优 缺 点 是 什么 ? 

4.4” 写 一 个 程序 实现 FIFO 页 面 蔡 换 和 FIFO 第 二 次 机 会 页 面 蔡 换 。 程 序 应 报告 每 一 页 
准备 放置 的 帧 和 页 面 错误 的 总 数 ， 可 以 假设 在 开始 时 每 个 帧 都 是 空 的 。 (注释 : 
每 次 页 面 载 入 帧 对 发 生 一 个 页 面 错误 ,) 使 用 4 个 内 存 帧 和 如 下 的 页 面 访 问 序列 测 
试 程序 。 
a. 1, 2, 3, 4, 5, 2, 6, 2, 7 
b. 1, 2, 3, 4, 5, 2, 1, 4, 2, 3 

45 ”在 共享 内 存 模 型 中 ， 预 读 取 数 据 有 助 于 性 能 的 优化 ， 讨 论 实现 自动 数据 预 读 取 的 
一 个 潜在 问题 。 
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4.6 描述 和 讨论 以 下 每 一 个 分 布 式 共享 内 存 访 问 类 型 的 一 个 优点 和 一 个 缺点 。 
a. 单 读 者 / 单 写 者 。 
b. 多 读者 / 单 写 者 。 
47 编写 一 个 程序 实现 具有 集中 式 服务 器 的 多 读者 / 单 写 者 DSM。 管 案 应 包括 一 个 集中 
式 服务 器 程序 和 一 个 参与 的 客户 机 程序 ， 服 务 器 和 客户 之 间 利 用 进程 间 通 信 。 另 
外 ， 服 务 器 和 客户 机 应 该 把 所 有 发 生 的 行为 和 接收 到 的 信息 记录 在 文件 中 。 使 用 
4 个 参与 客户 和 如 下 的 请 求 序列 及 自己 的 测试 数据 测试 程序 。 
a. 客户 1 到 客户 3 请 求 读 页 面 1。 
, 客户 4 请 求 写 页 面 1。 
, 客户 4 写 页 面 1。 
, 客户 2 到 客户 4 请求 读 页 面 2。 
, 客户 1 请求 写 页 面 1。 
客户 1 请 求 写 页 面 2。 
g. 客户 1 写 页 面 1 和 页 面 2。 
4.8 讨论 下 面 实现 内 存 迁 移 方法 的 优 缺点 。 
a. 停止 和 复制 。 
b. 并 发 复制 。 
c. 引用 时 复制 ， 数 据 保 留 在 原始 位 置 。 
103 d. 引用 时 复制 ， 数 据 在 文件 服务 器 。 


mo fo 过 


第 5 章 并 发 控制 


一 旦 有 多 线程 控制 或 多 进程 访问 共享 数据 和 资源 ， 就 必须 保证 访问 有 秩序 地 执行 ， 否 则 
会 产生 错误 的 结果 。 本 章 将 集中 讨论 并 发 控制 问题 。 并 发 控制 使 进程 在 各 自 的 跑道 上 运行 ， 
并 保证 在 分 布 式 或 并 行 系统 中 顺利 且 正 确 地 执行 ,因此 它 被 认为 是 分 布 式 计算 中 最 重要 的 问 
题 。 因 此 ， 尽 管 它 的 部 分 内 容 在 操作 系统 引 论 中 多 次 出 现 ， 本 章 还 是 将 详尽 地 对 其 进行 介 
绍 。5.1 节 介 绍 互 斥 和 临界 区 的 概念 以 及 三 点 测试 方法 。5.2 节 到 5.6 节 介绍 各 种 解决 互 斥 
问题 的 方法 。 具 体 地 说 ，5.2 节 介 绍 信号 量 ，5.3 节 介 绍 管 程 ，5.4 节 介 绍 锁 机 制 基础 ，5.5 
节 介 绍 软件 锁 控 制 ，5.6 节 介 绍 令 牌 传递 方法 。 本 章 还 包括 互 斥 的 可 能 结果 的 讨论 ， 尤 其 是 
5.7 节 中 关于 死 锁 的 问题 。 在 本 书 第 二 部 分 的 第 9 章 使 用 事务 管理 的 概念 ， 扩 展 了 数据 的 多 
访问 问题 ， 而 第 10 章 讨论 与 排序 和 同步 相关 的 问题 。 


5.1 互 斥 和 临界 区 


ARE (mutual exclusion) 保证 了 共享 资源 的 进程 不 同时 使 用 同一 个 资源 。 如 果 分 布 式 系 
统 的 用 户 到 打印 机 前 取 文 件 时 发 现 了 他 的 文件 与 好 几 位 同事 的 文件 按 页 交叉 地 放 着 ， 肯 定 不 
是 一 件 愉快 的 事情 。 用 户 希 望 他 们 的 文件 能 够 独占 打印 机 ， 并 连续 地 打印 出 来 。 使 用 互 斥 独 
占 访问 对 于 磁带 机 、 打 印 机 和 文件 来 说 是 必要 的 。 如 果 要 保证 峰值 性 能 ， 一 般 不 希望 不 必要 
地 停止 进程 。 访 问 共享 资源 的 程序 或 代码 称 为 临界 区 critical region)， 只 有 这 里 需要 禁止 并 
发 ， 称 为 并 发 控制 ， 并 通过 信号 量 (5.2 节 )、 管 程 (5.3 节 ) 或 本 章 讨论 的 其 他 任何 并 发 控 
制 机 制 (5.2 节 到 5.6 节 ) 来 实现 。 这 些 控制 机 制 通过 使 进程 停止 和 轮流 访问 资源 的 方式 来 
确保 互 斥 。 图 5-1 显示 了 两 个 进程 访问 和 改变 变量 foo 的 值 及 利用 临界 区 的 情况 。 在 附录 的 
外 科 手 术 调度 程序 中 使 用 了 一 个 基本 的 互 斥 操作 。 


HE A 
开始 
进入 临界 区 
ll 



















结束 





图 5-1 使 用 临界 区 保护 共享 变量 


下 面 讨论 本 章 给 出 的 各 种 解决 方案 的 评价 基础 。 有 具体 地 说 ， 互 斥 的 解决 方案 必须 通过 如 
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的 三 点 测试 : 

第 一 点 : 解决 方案 能 保证 两 个 进程 不 同时 进入 它们 的 临界 区 吗 ? 

第 二 点 : 解决 方案 能 防止 不 试图 进入 它们 临界 区 的 进程 产生 的 干扰 吗 ? 

第 三 点 : 解决 方案 能 防止 饥饿 吗 ? (饥饿 是 由 进程 永久 地 等 待 进入 临界 区 造成 的 ， 也 称 
为 无 限 等 待 -) 

接 下 来 讨论 一 些 现 有 的 解决 互 斥 问题 的 方案 。 


5.2 信号 量 


使 用 信号 量 实现 互 斥 的 思想 是 Dijkstra 在 1965 年 提出 的 [Dij65] ， 并 由 Algol 68 编程 语言 
实现 。 信 号 量 是 一 个 整 型 变量 ， 它 的 值 说 明了 受 保 护 资 源 的 状态 。 信 和 号 量 只 允许 两 个 操作 : 
raise 和 1cwer?。 当 进程 希望 进入 代码 的 临界 区 时 ， 它 必须 执行 lower ， 离 开 时 则 必须 执 
{J raise. raise 和 lower 检查 信号 量 的 值 ， 并 分 别 加 1 或 是 减 1。 信 和 号 量 检查 和 改变 是 作 
为 原子 操作 完成 的 ， 也 就 是 说 ， 该 操作 是 不 可 分 的 ， 并 且 不 可 间断 。 信 和 号 量 的 算法 详 见 详细 
说 明 $.1。 详 细 说 明 5.2 给 出 了 进程 使 用 信号 量 访问 共享 资源 的 范例 。 





详细 说 明 5.1 
信号 量 算法 











Let 
: Semaphore SEM; 

vf 初始 化 值 是 oo 
stem favorite _shared device; : 





TEN A 
If SEM >s0 
Retiirn{ true); 
ELSE 
Rait (until_raige) ; 
Return(trde) ; 
RAISE | | 
SEM~SEM+1; 7 如 果 不 只 一 个 进程 等 待 ， 系统 选择 - 
: : /1 哪 一 个 进程 接受 ratee 党 
/ft 


USING SEMAPHORE Tee : | 
Bla Bla Bla; // 执行 非 | ERER 


lower(sEM); — // Fe Ak 


‘critical _region.code; | 
{访问 共享 资源 
: raise (SEM) i = 


‘Bla Bla Bla; // 执行 非 临 界 区 代码 











O P 和 和 V 流 于 荷兰 语 ， 是 最 初 的 操作 的 名 称 。 
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详细 说 明 5.2 
信号 最 应 用 举例 








— 


. SEM =0; 
. SEM = -1; 


,SEM = ~3; 


SEM = a4; 


OO IAA PWN mH Oo 





-SEM = - 2; 





假设 进程 A、B、C、D 和 也 希 望 访问 受信 号 量 SEM 保护 的 共享 资源 。 这 里 通过 跟踪 
SEM 的 信 ， 介 绍 一 个 范例 。 我 们 还 假设 它们 者 使 用 详细 说 明 5.1 给 出 的 算法 ， 轩 5.2 
描述 了 所 有 的 行为 。 


EG 
URAB 执行 lower i 进入 临界 区 


/进程 A 执行 lower , Ft raise 


1// 进 程 C 执行 lower . FA raise 


HRE 执行 raise, AFERE 

= RARE r raise 进程 C, 进程 CHAWRE 
IRR C 执 行 raigse， 离 开 临 界 区 ， 
/raine Re A, MARE ， 

| RAD 执行 lower, 等 待 raise 
NRA A at raise, Arete | 





图 52 eR 





5.2.1 信号 量 的 缺点 


信号 量 的 缺点 包括 它 对 程序 员 的 依赖 。 信 号 量 依靠 程序 员 执 行 Lower 进入 临界 区 并 执 
行 raise 退出 临界 区 。 然 而 如 果 程 序 员 意外 地 使 用 另 一 个 lower 离开 临界 区 ， 这 将 会 发 生 
御 么 ?〈 要 知道 为 了 如 期 完成 任务 ， 在 读 晨 2 点 编程 ， 每 个 人 都 已 经 相当 疲 乱 ， 以 致 易于 发 
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ERR!) 信号 量 仍然 处 于 被 保护 状态 ， 没 有 进程 能 够 获得 raise， 与 这 些 资 源 相关 的 系统 
则 被 死 锁 ! 如 果 进 程 有 一 个 不 适时 的 〈 即 执行 lower 后 但 在 执行 raise 操作 前 ) AAMT, E 
会 发 生 类 似 的 死 锁 。 有 关 死 锁 的 问题 在 5.5 节 讨 论 。 


5.2.2 信和 号 最 评估 


我 们 根据 三 点 测试 对 信号 量 进行 评估 。 首 先 ， 信 号 量 能 保证 两 个 进程 不 同时 进入 它们 的 
临界 区 吗 ? 能 。 其 次 ， 信 和 号 量 能 防止 不 试图 进入 它们 临界 区 的 进程 产生 的 干扰 吗 ? 适当 利用 
的 情况 下 能 。 只 有 那些 已 经 表示 希望 进入 临界 区 的 进程 才 使 用 信号 量 ， 如 果 信 号 量 使 用 不 当 
(如 5.2.1 节 所 指出 的 那样 )， 不 再 想 进 入 临界 区 的 进程 就 会 阻碍 等 待 进 入 临界 区 的 进程 。 最 
后 ， 信 和 号 量 能 防止 饥饿 吗 ? 能 。 适 当 使 用 下 ， 信 号 量 本 质 上 不 具有 导致 永久 延迟 的 请 求 。 然 
而 ， 正 如 我 们 所 讨论 的 那样 ， 不 适当 的 使 用 会 导致 死 锁 。 总 之 ， 适 当 使 用 信号 基 能 够 通过 三 
点 测试 。 详 细 说 明 5.3 描述 了 UNIX 系统 V 中 对 信和 号 量 的 支持 。 最 后 应 注意 ， 信 和 号 量 在 真正 
的 分 布 式 环 境 中 很 难 实现 ， 并 应 尽量 避免 ， 因 为 必须 保持 信号 量 数据 的 绝对 一 致 性 。 关 于 保 
持 一 致 性 的 内 容 参 看 第 9 章 。 











t, | 所 有 细节 的 完全 
或 man semop) 的 手册 (在线 UNIX Fat) 中 都 有 
H ak AHRAEART HRS (WA nan - k 








5.3 FE 


管 程 是 由 Hoare [Hoa74] 和 Brinch Hansen [Bri75] 提出 的 一 种 高 层 的 同步 原 语 。 一 个 管 
程 是 一 个 编译 器 支持 的 编程 语言 结构 。 该 编程 语言 结构 允许 一 组 过 程 、 它 们 的 变量 和 数据 结 
构 组 合成 一 个 包 或 一 个 模块 。 也 就 是 说 ， 它 是 一 个 抽象 数据 类 型 。 其 他 非 管 程 进程 可 以 调用 
管 程 内 的 过 程 ， 但 不 能 访问 内 部 的 数据 结构 。 为 了 保证 互 斥 ， 管 程 不 允许 在 任 一 给 定时 间 ， 
在 管 程 内 有 超过 一 个 进 得 是 活动 的 。 如 果 一 个 管 程 内 有 一 个 活动 的 进程 ， 同 时 又 有 另外 一 个 
对 同一 个 管 程 内 过 程 的 调用 ， 那 么 新 的 过 程 调用 就 会 被 阻塞 ， 直 到 活动 的 进程 放弃 控制 。 在 
管 程 内 部 ， 编 译 器 经 常 使 用 一 个 二 进 制 的 信号 量 。 二 进 制 信号 量 是 只 有 两 种 值 的 信号 量 ， 只 
有 编译 器 而 非 程序 员 能 使 用 这 种 信和 号 量 ， 这 样 就 避免 了 程序 员 误 用 这 种 信和 号 量 的 可 能 。 程 序 
员 只 需要 关心 编译 器 的 错误 和 内 存 崩 溃 〈 内 存 裔 省 是 所 有 程序 员 的 恶 梦 ， 并 且 随 着 系统 复杂 
度 的 增加 而 增加 )。 


5.3.1 条 件 变 量 
按照 是 前 的 定义 ， 管 程 包括 若干 过 程 和 变量 ， 这 就 产生 了 如 下 的 问题 ， 如 果 受 到 管 程控 
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制 的 进程 A， 为 继续 运行 需要 进程 B 执行 一 个 特定 的 操作 。 假 如 B 的 操作 不 利用 管 程 中 的 任 

何 过 程 和 变量 ， 就 没有 任何 问题 。 但 是 如 果 B 需要 利用 管 程 内 的 过 程 来 执行 进程 A 继续 运 

行 所 必需 的 操作 ， 就 会 产生 困境 。 要 知道 ， 在 任何 时 间 内 ， 管 程 都 不 允许 其 内 的 进程 超过 一 

个 。 为 了 适应 这 种 情况 ， 管 程 引 和 人 条件 变量 。 条 件 变量 对 管 程 是 全 局 的 ， 但 又 包含 在 管 程 

内 。 类 似 信号 量 ， 条 件 变量 有 两 个 操作 wait 和 signal: wait 操作 挂 起 调用 进程 ，sig- 

nal 操作 继续 执行 进程 。wzit 类 似 于 信号 量 的 lower BMF, signal 却 与 信号 量 的 raise 

不 同 。 具 体 地 说 ， 如 果 进 程 没 有 被 挂 起 ，signal 操作 则 没有 意义 。 
PRAM REE ART signal， 进 程 B 等 待 允 许 在 管 程 内 激活 ， 结 果 将 会 如 何 ? 下 

面 列 出 两 个 选项 及 其 相对 优点 ; 
4 进程 A 继续 处 于 活动 状态 ， 直 到 离开 管 程 。 在 它 离开 管 程 后 进程 B 开始 活动 。 这 个 方 
法 的 优点 是 没有 上 下 文 转换 ， 因 而 效率 高 。 洪 在 的 问题 是 时 间 的 花费 和 在 进程 B 执行 
wait 和 接收 signal 之 间 发 生 了 计算 。 这 个 方法 是 Brinch Hansen 提出 的 【Bri75] 。 108 
4 进程 A 挂 起 并 允许 进程 B 处 于 活动 状态 (上下文 转 换 )。 当 进程 B 结束 后 ， 人 允许 进程 | 110 
A 重 新 处 于 活动 状态 〈 另 一 个 上 下 文 转换 )。 尽 管 这 个 方法 涉及 更 多 的 上 下 文 转换 ， 
但 它 保 证 了 行为 的 准确 。 这 个 方法 是 Hoare 提出 的 [Hoa74]。 


5.3.2 管 程 评估 


我 们 根据 三 点 测试 对 管 程 进 行 评估 。 首 先 ， 管 程 能 保证 两 个 进程 不 同时 进 人 它们 的 临 
界 区 吗 ? 能 。 其 次 ， 管 程 能 防止 不 试图 进入 它们 临界 区 的 进程 产生 的 干扰 吗 ? 能 ， 管 程 在 某 
一 时 刻 只 允许 其 内 的 一 个 进程 处 于 活动 状态 ， 只 有 当前 处 于 活动 状态 的 进程 或 等 待 成 为 活动 
ARE RRMA RA RARE, RA, SREB IL DIRS? 能 ， 因 为 编译 器 实现 了 用 
来 提供 互 斥 的 信号 量 。 然 而 ， 在 任何 不 使 用 共享 内 存 的 高 级 环境 中 ， 对 管 程 来 说 却 有 一 
重 的 缺陷 ， 就 是 编译 器 依靠 共享 内 存 实 现 信号 量 。 总 之 ， 没 有 共享 内 存 ， 就 不 能 使 用 管 程 。 
详细 说 明 5.4 给 出 了 Java 中 使 用 管 程 的 概况 。 


详细 说 明 5.4 
Java 的 管 程 


























5.4 $ 


正如 我 们 所 知道 的 那样 ， 互 斥 涉 及 使 用 共享 资源 的 进程 ， 同 时 需要 保证 只 有 一 个 进程 在 fu] 
使 用 上 述 共享 资源 。 锁 是 日 常生 活 中 防止 他 人 进入 的 一 个 工具 ， 同 样 ， 它 也 能 使 其 他 进程 不 
使 用 共享 资源 。 一 个 锁 有 丙种 状态 : 上 锁 和 未 上 锁 。 所 以 它 能 提供 资源 的 并 发 控制 和 互 斥 。 
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如 果 一 个 进程 希望 使 用 共享 资源 ， 它 首先 检查 这 个 共享 资源 是 个 上 锁 。 如 果 资 源 没有 上 锁 ， 
这 个 进程 就 锁 住 资 源 继 续 执行 。 看 起 来 很 简单 ! 然而 考虑 一 下 详细 说 明 5.5 的 情况 : 两 个 资 
源 都 想 进 入 临界 区 且 同 时 发 现 资源 未 上 锁 ， 这 导致 一 个 共 知 的 竞争 状态 ， 就 可 能 会 允许 两 个 
进程 同时 进入 临界 区 ! 显然 ， 这 不 是 并 行 控制 所 期 望 的 输出 ， 也 没有 提供 互 斥 。 本 节 将 要 讨 
论 避 免 这 种 竞争 状态 并 成 功 实现 锁 的 各 种 方法 。 








详细 说 明 5.5 
竞争 状态 示例 


maser 















FHP RAARNRAB ARAL OR EMH ORD, 结果 叶 致 不 正确 的 执行 。 
‘1. 进程 A 检查 锁 状 态 。 
2. 进程 A 发 现 锁 处 于 未 横 状 态 。 

3， Ho yy Seek ae ee oie 





a AA ASRBEMESS, BARTARKA!) 
。 10. 进程 A 执行 临界 区 程序 。 





5.4.1 轮转 


轮转 是 大 多 数 人 在 人 学 前 就 学 会 的 一 个 很 简单 的 概念 。 如 果 多 个 进程 希望 共享 资源 ， 那 
就 让 它们 轮流 享用 吧 。 这 个 方法 不 允许 进程 放弃 自己 的 机 会 。 再 假设 进程 A 和 进程 B 共享 
资源 ， 如 果 进 程 A 使 用 资源 ， 那 么 接 下 来 使 用 资源 的 必 是 进程 B， 进 程 B 也 不 能 放弃 。 因 为 
它 不 允许 放弃 ， 所 以 这 种 方法 也 称 为 严格 轮转 变更 。 轮 转 通过 一 个 变量 实现 。 如 果 两 个 进程 
共享 资源 ， 变 量 可 以 为 0 或 1。 进 程 A 初始 化 变量 为 0， 当 它 完成 临界 区 的 程序 后 ， 改 变 变 
量 的 值 为 1。 除非 进程 B 进入 临界 区 并 从 临界 区 退出 ， 否 则 变量 的 值 都 不 会 也 不 能 改变 。 如 
果 进 程 A 希 望 进入 临界 区 ， 它 首先 检查 变量 的 值 ， 如 果 变量 为 0， 继续 执行 ， 否 则 等 待 。 这 
种 情况 下 ， 进 程 A 会 不 断 地 检查 变量 的 值 。 这 种 不 断 检查 的 过 程 称 为 性 等 待 。 忙 等 待 浪费 
系统 资源 ， 系 统 资源 被 不 断 地 检查 变量 值 天 消耗 掉 。 而 不 断 的 检查 称 为 循环 检查 (spin- 
ning) ， 不 断 检查 的 变量 称 为 循环 检查 锁 (spinlock)。 也 就 是 说 ， 忙 等 待 实现 在 循环 检查 锁 上 
进行 循环 检查 。 
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我 们 根据 三 点 测试 对 轮转 进行 评估 。 首 先 ， 轮 转 能 保证 两 个 进程 不 同时 进入 它们 的 临界 
K? 能 ， 进 程 只 能 根据 轮流 状态 进入 临界 区 ， 进 程 不 能 同时 改变 变量 。 其 次 ， 轮 转 能 防止 
不 试图 进入 它们 临界 区 的 进程 产生 的 干扰 蚂 ? 不 能 ， 如 果 进 程 B 不 想 进入 临界 区 ， 它 会 阻 
碍 进程 A 进入 临界 区 。 最 后 ， 轮 转 不 能 防止 饥 狐 。 考 虑 进程 A 不 试图 进入 临界 区 改变 变量 
的 值 ， 进 程 B 将 永远 禁止 进入 临界 区 ， 因 而 会 遭受 饥饿 。 总 之 ， 这 个 解决 方案 不 能 通过 三 
点 测试 ， 但 如 果 并 人 第 2 章 介绍 的 轮 询 方法 就 会 纠正 轮转 的 缺陷 。 作 为 练习 ， 评 佑 一 下 修改 
之 后 的 方法 。 


5.4.2 原子 操作 和 硬件 支持 


利用 锁 来 解决 互 斥 问题 的 系列 方案 还 涉及 原子 操作 。 第 一 种 解决 方案 通过 实现 原子 的 
(不 可 分 的 ) 检查 和 设置 (check-and-set) 操作 ， 防 止 了 如 详细 说 明 5.5 中 介绍 的 竞争 状态 。 
因 操 作 是 原子 的 ， 另 一 进程 不 可 能 执行 任何 与 检查 和 设置 锁 操 作 交 织 的 操作 ， 这 个 操作 也 称 
为 测试 和 加 锁 ， 通 常 由 硬件 支持 以 保证 原子 操作 。 如 果 两 个 进程 同时 想 检查 和 设置 ， 系 统 通 
过 使 用 硬件 支持 决定 哪 一 个 进程 先 执行 。 

涉及 原子 操作 的 第 二 个 解决 方案 是 交换 。 交 换 一 般 使 用 一 个 临时 变量 ， 执 行 三 条 语句 。 
原子 交换 能 够 用 一 个 表示 共享 资源 处 于 被 锁 状 态 的 值 交换 出 锁 状 态 的 当前 值 。 这 时 进程 测试 
它 交 换 出 来 的 变量 值 。 如 果 交 换 出 来 的 值 说 明 已 经 被 锁 ， 进 程 就 不 能 继续 执行 ， 变 量 仍 处 于 
被 锁 状 态 。 但 如 果 交 换 出 来 的 值 说 明 未 锁 ， 因 变量 已 处 于 被 锁 状 态 〈 由 交换 导致 ) ， 进 程 就 
会 进入 临界 区 ， 如 图 5-3 所 示 。 同 样 ， 如 果 两 个 进程 同时 想 执行 交换 ， 系 统 会 通过 使 用 硬件 
支持 决定 娜 一 个 进程 先 执行 。 


Fena.. N (A) 进程 不 能 进入 临界 区 
它 被 锁 了 ! ` 旧 值 


( y 
° 原子 交换 
Ag 








(B) 进程 可 以 进入 临界 区 
MARA. 
只要 锁 上 它 ! 人 ma 


图 5-3 原子 交换 
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我 们 根据 三 点 测试 对 原子 操作 方案 进行 评估 。 首 先 ， 原 子 操作 方案 能 保证 互 斥 。 其 次 ， 
它 能 防止 不 试图 进入 它们 临界 区 的 进程 产生 的 干扰 。 第 三 ， 希 望 访问 受 原子 操作 保护 的 共享 
资源 的 进程 不 会 饥饿 ， 而 总 会 被 安排 并 获得 进入 临界 区 的 机 会 。 对 高 级 系统 评估 这 种 方案 很 
困难 。 原 子 操作 很 难 在 并 行 计算 机 的 硬件 中 实现 ,但 却 在 一 些 系统 中 使 用 ， 多 物理 计算 机 的 
分 布 式 系统 需 依靠 软件 实现 。 


5.5 软件 锁 控 制 


当 硬 件 支持 锁 不 可 行 的 时 候 ， 需 要 使 用 软件 实现 。 分 布 式 解决 方案 经 常 利用 软件 提供 各 
种 不 同类 型 的 锁 ， 从 而 与 第 4 章 讨论 的 内 存 管 理 调度 (具体 内 容 是 提供 了 读 锁 和 写 锁 ) 一 
致 。 分 布 式 锁 控制 的 解决 方案 利用 了 集中 式 锁 管 理 器 或 分 布 式 锁 管 理 器 。 下 面 就 讨论 这 两 种 
基本 的 方法 。 


5.5.1 集中 式 锁 管 理 器 


与 使 用 集中 式 控 制 的 分 布 式 计算 中 的 每 一 个 解决 方案 一 样 ， 利 用 集中 锁 管 理 器 导致 了 单 
个 关键 元 素 和 单 点 失败 ， 所 有 这 些 方法 在 分 布 式 实时 应 用 中 不 可 行 。 如 果 锁 管理 器 崩溃 ， 整 
个 系统 都 会 受害 。 在 集中 式 管 理 点 周围 会 引起 流量 的 增加 ， 如 果 需 求 足够 大 还 会 导致 系统 找 
颈 。 锁 管理 器 执行 的 功能 大 多 数 与 集中 式 系统 的 硬件 所 执行 的 功能 一 样 ， 服 务 器 维护 进程 请 
求 进入 临界 区 的 信息 以 及 允许 进程 访问 的 资源 的 信息 。 集 中 锁 管理 器 方案 涉及 三 种 必需 消息 
和 一 种 可 选 消息 ， 

4 Request。 这 个 消息 从 请 求 的 进程 传输 到 集中 式 锁 管理 器 ， 它 的 目的 是 请 求 进入 临界 区 。 

4 Queued。 这 个 消息 是 可 选 的 ， 由 集中 式 锁 管理 器 传输 到 请 求 的 进程 。 在 请 求 不 能 立即 

应 答 的 情况 下 使 用 此 消息 ， 用 于 通知 运程 已 收 到 请 求 ， 请 等 待 处 理 后 的 消息 。 不 能 立 

即 应 答 的 请 求 按 照 先 来 先 服务 的 次 序 放置 在 队列 中 。 如 果 没 有 使 用 这 个 可 选 的 消息 ， 

成 员 就 很 难 区 分 一 个 死 的 集中 式 锁 管理 器 和 一 个 忙 的 集中 式 锁 管理 器 。 

4 Granted。 这 个 消息 从 集中 式 锁 管 理 器 传输 到 请 求 的 进程 ， 只 在 进程 可 以 进入 临界 区 的 

时 候 传输 。 如 果 请 求 被 接收 但 不 能 接受 服务 ， 请 求 的 进程 收 到 可 选 的 “Queued” 消 息 

或 什么 都 收 不 到 。 a 

4 Release。 这 个 消息 从 已 经 接受 过 服务 的 RA 

请 求 进程 传输 到 集中 式 锁 管理 器 ， 它 

说 明 进 程 已 经 结束 了 它 的 临界 区 程序 ， 

并 释放 锁 。 这 时 候 ， 集 中 式 锁 管理 器 

发 送 “Granted” 消 息 给 队列 中 的 下 一 

个 进程 。 

图 5-4 描述 了 一 个 带 有 三 个 都 请 求 进入 临 
界 区 进程 的 集中 式 锁 管理 器 的 功能 ， 例 中 使 
用 了 三 个 必需 消息 和 可 选 的 “Queued” 消 息 。 

我 们 根据 三 点 测试 对 集中 式 锁 管理 器 进 
行 评估 。 首 先 ， 它 能 保证 两 个 进程 不 同时 进 
人 它们 的 临界 区 吗 ? E, 集中 锁 管理 器 在 某 图 5-4 集中 式 锁 管理 器 
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们 临界 区 的 进程 产生 的 干扰 吗 ? 能 ， 当 某 一 进程 进入 临界 区 时 ， 上 只 有 一 个 执行 临界 区 程序 的 
进程 或 队列 中 的 其 他 进程 能 够 产生 影响 。 最 后 ， 它 能 防止 饥饿 吗 ? 能， 这 个 算法 按照 接收 请 
求 的 顺序 提供 服务 ， 因 而 很 公平 ， 能 够 在 某 一 时 刻 所 有 提交 请 求 的 进程 提供 服务 。 


5.5.2 分 布 式 锁 管理 器 


实现 锁 管理 器 的 分 布 式 解决 方案 有 两 种 必需 消息 和 一 种 可 选 消息 ， 虽 然 它 与 集中 锁 管 理 
器 有 许多 相似 之 处 ， 但 还 是 有 一 些 区 别 如 下 : 

© 谁 接收 这 些 消息 。 

4 谁 发 送 这 些 消息 。 

9 进入 临界 区 的 必要 条 件 是 什么 。 

下 面 讨论 这 些 消息 ， 包 括 关 于 发 送 者 和 接收 者 的 信息 。 

1. Request。 这 个 消息 从 请 求 的 进程 传输 到 系统 中 所 有 的 成 员 。 它 可 以 分 别传 送 给 每 个 
成 员 或 利用 组 通信 和 机制 ， 目 的 是 请 求 进入 临界 区 。 所 有 的 请 求 包括 一 个 源 时 间 稚 ， 第 10 章 
给 出 了 分 布 式 环境 中 利用 时 间 蕉 的 算法 。 

2. Queued。 这 个 消息 是 可 选 的 ， 由 接收 到 “Request” 消 息 的 进程 传输 给 请 求 的 进程 。 
它 可 以 用 于 通知 进程 请 求 已 经 收 到 ， 请 等 待 下 一 步 处 理 后 的 消息 。 在 请 求 不 能 立即 答应 的 所 
有 情况 下 都 可 使 用 此 消息 。 成 员 在 执行 临界 区 程序 的 时 候 或 之 前 已 经 发 出 请 求 消息 (由 时 间 
BRE) 但 仍 未 执行 的 情况 下 不 会 答应 请 求 。 任 何 被 拒绝 的 请 求 都 会 放置 在 队列 中 ， 直 到 临 
界 区 程序 结束 或 请 求 完成 。 如 果 没 有 使 用 这 个 可 选 的 消息 ， 就 很 难 区 分 一 个 死 的 成 员 和 一 个 
忙 的 成 员 。 

3. Granted。 这 个 消息 在 两 种 情况 下 从 所 有 的 成 员 传输 到 请 求 的 进程 。 第 一 ， 如 果 成 员 
不 在 临界 区 且 没 有 一 个 更 早 时 间 戳 的 进入 临界 区 的 请 求 ， 就 发 送 一 个 “Granted” 消 息 。 第 
二 ， 当 成 员 有 一 个 排队 的 请 求 ， 它 就 会 在 自己 完成 临界 区 程序 后 发 送 一 个 “Granted” 消 息 给 
队列 中 其 他 所 有 的 成 员 。 这 种 情况 基本 等 价 于 集中 式 方法 的 “Release” 消 息 。 如 果 接 收 的 
“Request” 消 息 不 能 被 答应 〈 如 进程 在 临界 区 或 有 一 个 更 早 时间 戳 的 请 求 ) ， 请 求 的 进程 就 收 
到 可 选 的 “Queued” 消 息 或 什么 都 收 不 到 。 

下 面 讨论 许可 的 问题 。 在 集中 式 方 法 中 有 一 个 锁 管 理 器 , “Granted” 消 息 是 进 和 人 临界 区 
的 绝对 权威 。 在 分 布 式 锁 管 理 器 算法 中 , “Granted” 是 应 答 许可 的 一 张 选 票 ， 而 不 是 绝对 的 
许可 。 利 用 分 布 式 锁 管理 器 的 早期 解决 方案 需要 意见 一 致 的 决定 : 成 员 必须 收 到 其 他 进入 临 
界 区 的 每 一 个 成 员 的 “Granted ”选票 。 这 样 很 复杂 ， 很 难 知道 谁 参加 了 分 布 式 系统 和 在 某 一 
时 刻 有 多 少 成 员 ， 因 为 成 员 进 人 系统 并 因 休息 、 般 省 和 网 络 故 障 而 离开 。 如 果 必 须要 一 致 的 
决定 ， 所 有 成 员 都 是 关键 因素 ， 这 是 不 易 接 受 的 ! 一 个 变通 的 办 法 是 需要 一 个 多 数 选票 ， 某 
个 成 员 接收 到 大 多 数 成 员 的 “Granted” 消 息 就 能 进入 临界 区 。 

我 们 根据 三 点 测试 对 分 布 式 锁 管理 器 解决 方案 进行 评估 。 首 先 ， 它 能 保证 两 个 进程 不 同 
时 进入 它们 的 临界 区 吗 ? 能 ， 使 用 意见 一 致 的 决定 ， 所 有 成 员 一 起 决定 允许 某 一 进程 继续 执 
行 ; 使 用 多 数 选票 ， 大 多 数 成 员 决 定 允 许 谁 进入 临界 区 继续 执行 。 这 里 只 有 一 个 多 数 ， 因 多 
个 的 多 数 需 要 重复 的 成 员 ， 且 需要 成 员 在 发 送 “Granted” 消 息 之 前 检查 更 早 的 请 求 。 因 此 ， 
多 个 进程 不 能 同时 接收 到 进入 临界 区 的 适当 许可 。 其 次 ， 它 能 防止 不 试图 进入 它们 临界 区 的 
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进程 产生 的 干扰 吗 ” 不 能 和 能 。 在 意见 一 致 决定 实现 中 ， 进 程 如 果 没 有 其 他 所 有 成 员 的 
“Granted ”选票 就 不 能 继续 ; 如 果 某 一 个 成 员 崩 演 ， 就 不 会 再 有 其 他 的 成 员 继 续 运 行 ， 这 样 
崩 泪 的 成 员 就 阻碍 了 其 他 进程 进入 临界 区 。 所 以 ， 意 见 一 致 实现 在 这 点 上 不 能 。 相 反 ， 因 大 
多 数 选票 的 方法 允许 单个 系统 失败 ， 所 以 能 通过 第 二 点 的 测试 。 最 后 ， 它 能 防止 饥饿 吗 ? A 
请 求 按照 排序 的 方式 被 服务 ， 所 以 所 有 的 请 求 都 能 被 服务 ， 没 有 进程 会 遭受 饥 俄 。 总 之 ， 意 
见 一 致 的 方法 不 能 通过 三 点 测试 ， 多 数 选票 的 方法 能 通过 。 


5.6 令 牌 传递 互 斥 


互 斥 的 令 牌 传递 解决 方案 目的 是 在 通过 网 络 相 联 的 多 处 理 器 〈 并 行 或 分 布 式 ) 中 使 用 ， 
它 由 一 个 令 牌 和 一 个 遍历 所 有 处 理 器 的 路 径 一 一 逻辑 环 组 成 。 为 了 进入 临界 区 ,进程 必 须 获 
得 这 个 令 牌 。 因 为 只 有 一 -个 令 牌 ， 所 以 只 有 一 个 进程 可 以 进入 临界 区 。 当 进程 退出 临界 区 
时 ， 令 牌 释 放 到 系统 中 。 如 果 没 有 进程 希望 运 和 人 临界 区 ， 令 牌 就 持续 不 断 地 循环 。 虽 然 这 个 
方法 很 理想 ， 但 也 会 引 趣 一 些 问 题 。 | 

4 如 何 判定 令 牌 是 丢失 还 是 长 时 间 地 使 用 ? 

4 如 果 拥 有 令 牌 的 进程 月 演 了 很 长 时 间 将 如 何 ? 

4 如 果 一 个 处 理 器 离开 (自愿 或 因 故 障 ) 系统 ， 如 何 维护 逻辑 环 ? 

4 如 何 辨认 和 增加 加 入 逻辑 环 的 处 理 器 ? 

这 里 的 某 些 顾虑 能 通过 指派 一 个 或 两 个 特定 区 域 作 为 监控 器 来 解决 。 监 控 器 会 偶尔 发 送 
消息 询问 令 牌 持 有 者 ， 如 果 没 有 应 符 ， 则 在 网 络 中 放置 一 个 新 的 令 牌 。 监 控 器 登记 新 成 员 同 
时 记录 委 失 的 成 员 。 确 认 丢 失 成 员 最 简单 的 方法 是 通过 它 的 邻居 。 当 处 理 器 试图 传递 令 牌 的 
时 候 ， 它 等 待 确 认 。 如 打 没 有 确认 ， 则 再 传 一 次 ; 如 果 再 次 没有 确认 ， 就 认为 它 的 邻居 已 委 
失 ， 并 通知 监控 器 记录 和 指派 新 的 邻居 。 

我 们 根据 三 点 测试 玉 这 个 解决 方案 进行 评估 。 首 先 ， 它 能 保证 两 个 进程 不 同时 进入 它们 
的 临界 区 吗 ? 能 ， 人 逻辑 环 在 任何 时 候 都 只 有 一 -个 令 牌 ， 即 使 利用 两 个 监控 器 ， 令 牌 丢 失 的 时 
候 也 只 会 在 系统 中 放置 一 个 新 的 令 牌 。 其 次 ， 它 能 防止 不 试图 进入 它们 临界 区 的 进程 产生 的 
FRE? 能 ， 一 个 不 相关 的 进程 只 会 传递 令 牌 ， 不 会 阻碍 。 最 后 ， 它 能 防止 饥饿 吗 ? FE, AT 
有 的 进程 都 受到 公平 和 平等 待遇 。 


5.7 死 锁 


到 目前 为 止 ， 本 章 都 在 讨论 互 斥 ， 本 节 将 要 讨论 的 是 互 斥 可 能 产生 的 一 个 副作用 。 具 体 
地 说 ， 互 斥 是 四 个 导致 死 锁 的 分 配 条 件 之 一 。 如 果 以 下 四 个 条 件 成 立 ， 就 会 发 生死 锁 吗 ? 
LF: 就 像 我 们 所 知道 的 那样 ， 它 是 提供 进程 独占 式 访 问 资源 的 一 种 资源 分 配方 法 ， 








用 于 防止 资源 的 并 发 共享 。 
4 非 抢占 资源 分 配 : 一 种 系统 提供 进程 的 资源 访问 , 但 系统 不 能 强迫 进程 放弃 资源 的 
控制 。 


4 持 有 和 和 等待， 进程 持 有 一 个 资源 并 且 等 待 男 一 个 资源 。 

4 循环 等 待 : 在 资源 分 配 图 中 有 一 个 循环 路 径 ， 其 中 的 每 个 进程 持 有 至 少 一 个 资源 ， 而 
且 这 个 资源 在 进程 获得 该 环 路 中 另 一 个 成 员 所 持 有 的 资源 之 前 不 会 被 放弃 。 如 果 没 有 
持 有 和 等 待 ， 就 不 会 发 生 循 环 等 待 。 
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因此 ， 死 锁 是 具有 不 适当 资源 分 配 的 系统 状态 ， 导 致 两 个 或 更 多 的 进程 不 能 改变 状态 以 完成 
运行 。 如 果 不 存在 上 述 的 任 一 条 件 ， 就 不 会 发 生死 锁 。 

让 我 们 看 一 下 图 5-5 (A) 资源 分 配 图 中 描述 的 两 个 进程 和 两 个 资源 之 间 的 一 个 简单 的 
死 锁 例 子 。 所 有 方向 朝 资源 的 箭头 是 请 求 资 源 ， 而 离开 资源 的 箭头 代表 分 配 。 每 个 进程 已 有 
一 个 资源 并 想得到 另外 一 个 资源 。 除 非 它 得 到 并 使 用 了 其 他 资源 ， 否 则 不 放弃 已 有 的 资源 
(循环 持 有 和 等 待 )。 注 意 如 果 引 和 抢占， 进程 就 会 被 迫 放弃 资源 ， 那 么 循环 也 就 断 开 了 ， 因 
此 也 不 会 有 死 锁 ， 如 图 5-5 (B)。 如 果 进 程 能 并 发 共享 资源 (没有 互 斥 )， 那 么 循环 也 不 再 
是 问题 ， 同 样 不 会 有 死 锁 ， 如 图 5-5(C)。 最 后 看 一 个 没有 循环 的 例子 ， 如 图 5-5 (D)， 没 
有 循环 ， 进 程 就 不 会 被 禁止 运行 ， 因 而 就 没有 死 锁 。 死 锁 只 在 进程 独占 资源 ， 但 不 能 抢占 并 
涉及 一 个 分 配 循 环 的 时 候 发 生 。 





CA) 死 锁 B) 有 抢占 
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图 5-5 资源 分 配 图 


如 果 资 源 是 分 布 式 系统 的 缓冲 空间 ， 那么 死 锁 一 般 称 为 通信 死 锁 。 如 果 通 信 死 锁 只 涉及 
两 个 位 置 ， 那 么 它 就 称 为 直接 存储 转发 死 锁 ;， 如 果 涉 及 多 个 位 置 ， 则 称 为 间接 存储 转发 死 锁 。 

如 何 处 理 死 锁 呢 ? 使 用 助 记 符 PAID 记 住 相应 的 方法 : Bk (Prevent), W4 (Avoid), 
忽略 (Ignore) 或 检测 (Detect)。 接 下 来 讨论 每 一 种 方法 。 


5.7.1 防止 死 锁 
为 了 防止 死 锁 ， 必 须 防 止 前 面 提 到 的 任何 一 个 分 配 条 件 。 本 章 一 直 讨 论 第 一 个 分 配 条 件 
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一 一 互 斥 ， 它 是 访问 如 打印 机 资源 的 必要 条 件 ， 所 以 不 是 避免 死 锁 的 一 个 选择 。 打 印 机 也 体 
现 系 统 为 什么 不 采取 抢占 一 一 第 二 个 分 配 条 件 ， 因 为 这 样 会 产生 多 个 打印 任务 相互 于 扰 ， 可 
能 会 打印 到 同一 页 上 。 如 果 没 有 持 有 和 等 待 ， 循 环 等 待 也 不 会 发 生 ， 所 以 只 剩 下 一 个 分 配 条 
件 可 以 打破 。 打 破 这 个 分 配 条 件 的 方法 有 好 几 个 ,但 都 有 缺点 ， 下 面 分 别 介 绍 。 
4 只 允许 持 有 单一 资源 。 如 果 一 个 进程 只 允许 持 有 一 个 资源 ， 而 不 允许 持 有 多 个 资源 ， 
就 不 会 有 循环 ! 这 个 方法 很 麻烦 ， 因 为 有 些 进程 需要 同时 访问 多 个 资源 。 
4 预 分 配 资源 。 这 个 方法 强迫 每 个 进程 在 初始 化 执行 之 前 获得 需要 访问 的 所 有 资源 ， 所 
以 资源 有 效 利用 的 问题 就 出 现 了 。 假 设 有 个 进程 需要 三 周 完成 运行 ， 在 运行 结束 时 需 
要 访问 资源 ， 预 分 配 会 迫使 进程 专用 这 个 资源 并 在 使 用 它 之 前 的 三 周 时 间 内 一 直 让 它 
处 于 无 用 状态 ! 这 样 效 率 就 会 很 低 。 
4 强迫 释 放 再 请 求 。 这 个 方法 强迫 每 个 进程 在 另外 请 求 资 源 之 前 释放 所 有 已 分 配 的 资 
源 ， 这 样 允 许 任 何等 待 被 其 他 进程 持 有 的 资源 的 进程 能 够 继续 运行 ， 因 而 防止 了 循环 
持 有 和 等 待 ， 但 对 有 些 应 用 这 个 方法 就 不 太 实用 。 
4 按 序 获得 。 这 个 方法 为 所 有 资源 编号 ， 进 程 只 能 请 求 序号 高 于 自己 所 拥有 的 资源 的 资 
121 源 。 因 为 不 能 请 求 更 低 序 号 的 资源 ， 所 以 不 可 能 产生 循环 ， 也 就 避免 了 死 锁 。 但 在 分 
布 式 环境 中 用 这 种 方式 对 所 有 的 资源 进行 排序 ， 工 作 繁 重 并 且 效 率 很 低 。 尤 其 是 谁 都 
不 愿意 被 分 配 到 序号 最 高 的 资源 。 
4 资历 规则 。 这 个 方法 使 用 时 间 惟 (第 10 章 讨论 ) 保证 进程 上 时 间 惟 的 惟一 。 如 果 朋 
BER CRIT RL) 请 求 一 个 资源 ， 屠 人 么 任何 持 有 这 个 资源 的 进程 都 必须 放弃 它 。 资 
格 老 的 进程 总 会 赢 ， 而 年 轻 的 进程 必须 小 心地 保持 自己 的 完整 性 以 防 死 锁 《〈 详 见 第 9 
章 的 事务 管理 )。 


5.7.2 避免 死 锁 


回忆 集中 式 系统 中 的 死 锁 避免 算法 ， 所 有 的 算法 都 强迫 进程 提前 给 出 需求 。 在 需求 给 出 
以 后 ， 避 免 死 锁 的 算法 ( 因 NP 完全 性 的 原因 而 特别 缓慢 ) 决定 能 否 进行 安全 分 配 。 如 果 
能 ， 人 允许 进程 继续 运行 并 分 配给 所 需 的 资源 。 但 同时 也 会 出 现 问 题 ， 首 先 没 有 进程 能 够 准确 
预计 需求 ， 其 次 算法 太 慢 以 至 不 能 用 于 集中 式 环境 中 。 因 此 ， 很 少 有 人 愿意 增加 网 络 延迟 以 
换取 现成 的 慢 算法 。 在 分 布 式 环境 中 使 用 这 个 算法 将 会 更 慢 ， 所 以 下 面 接着 讨论 忽略 死 锁 。 


5.7.3 ARIM 


忽略 死 锁 是 UNK 采用 的 方法 ， 并 受到 多 数 人 欢迎 ， 它 迎合 了 哲学 观点 “ 别 担心 ， 会 好 
的 "， 其 实 这 个 方法 只 是 选择 忽略 问题 。 如 果 系 统管 理 员 发 现 系统 有 问题 ,或 者 从 用 户 那里 
听 到 抱 奶 ， 那 么 管理 员 进 行 调查 (或 派别 人 调查 ) 并 试图 解决 问题 。 通 常 ， 死 锁 进 程 的 主人 
(RUA) 开始 烦躁 ， 这 位 烦躁 的 用 户 一 般 取 消 进程 ， 从 而 打破 循环 持 有 和 等 待 ， 问 题 也 
迎刃而解 了 ! 这 个 方法 也 称 为 恢复 。 


5.7.4 检测 死 锁 


在 所 有 处 理 死 锁 的 PAID 方案 中 ， 检 测 是 研究 最 多 的 领域 。 (多 少 人 会 同意 研究 忽略 ?) 
检测 方法 不 关心 死 锁 的 产生 ， 只 注重 寻找 已 经 产生 的 死 锁 。 一 旦 找到 死 锁 ， 就 会 采取 相应 的 
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方法 消除 死 锁 。 像 我 们 以 前 所 讨论 的 问题 一 样 ， 检 测 死 锁 的 方法 在 集中 式 和 分 布 式 系统 中 各 
有 优 缺 点 。 在 这 个 领域 内 有 两 篇 经 常 被 引用 的 调查 : [Kna87] 和 [Sin89]。 这 里 将 集中 讨论 
一 个 异乎 寻 常 且 成 功 的 解决 方案 ， 这 就 是 Chandy, Misra 和 Haas [CMH832] 提出 的 分 布 式 解 
决 方案 。 这 个 方案 基于 探测 消息 ， 就 是 不 论 进程 获取 资源 失败 或 时 间 用 完 都 会 发 送 具体 的 消 
息 。 探 测 消息 包括 如 下 三 个 字段 : 

1. 阻塞 进程 的 标识 。 

2. 发 送 这 个 消息 的 进程 的 标识 。 

3. 消息 发 送 的 目标 进程 的 标识 。 

发 送 探 测 的 过 程 如 下 ; 

1. 阻塞 进程 (A) 初始 化 探测 消息 。 探 测 消息 被 发 送 给 等 待 的 资源 持 有 者 (B), RÈ 
者 (A) 把 自己 的 标识 放 在 探测 消息 的 字段 1 和 字段 2， 把 资源 持 有 者 (B) 放 在 字段 3。 

2. 资源 持 有 者 接收 探测 消息 。 如 果 位 置 (B) 没有 等 待 男 外 位 置 的 资源 ， 它 就 终止 探 
测 消息 。 但 如 果 位 置 (B) 在 等 待 另 一 位 置 (C) 的 资源 ， 它 就 根据 步骤 3 转发 探测 消息 。 

3. 转发 探测 消息 给 (C) (所 有 位 置 )。 探 测 消息 做 如 下 改动 : 字段 1 不 变 ， 字 段 2 成 为 
(B) 的 进程 标识 ， 字 段 3 标识 新 的 接收 者 (C)。 

4， 如 果 字 段 1= 字段 3， 则 存在 死 锁 ; 否则 从 第 2 步 开 始 重复 。 

如 果 字 段 1 等 于 字段 3， 则 出 现 死 锁 。 也 就 是 说 ， 探 测 消息 又 被 送 回 它 的 始 发 者 。 举 一 
个 简单 的 例子 ， 考 虑 直接 存储 转发 死 锁 的 情形 ， 使 用 (A，A，B) 发 送 第 一 个 探测 消息 ， 位 
置 B 接收 到 消息 后 使 用 (A, B, A) 把 探测 消息 发 送 给 A， 这 样 循环 就 被 识别 ， 从 而 发 现 了 
死 锁 。 

既然 死 锁 已 被 识别 ， 我 们 有 三 种 选择 来 消除 死 锁 。 第 一 ， 可 以 谋求 系统 操作 员 的 帮助 。 
第 二 ， 可 以 终止 进程 〈 就 像 忽 略 方法 !)。 第 三 ， 回 滚 系统 ， 这 是 第 9 章 讨 论 的 事务 的 一 个 特 
征 。 假 如 你 是 系统 操作 员 ， 你 选择 终止 一 个 或 两 个 进程 即 可 继续 。 最 明显 的 选择 是 优先 级 
低 、 且 没有 使 用 大 部 分 系统 资源 的 进程 ， 同 时 也 不 是 你 老板 的 。 为 了 防止 将 来 可 能 的 饥饿 ， 
终止 了 的 进程 通常 会 增加 一 个 优先 级 ， 这 样 不 至 于 在 将 来 发 生死 锁 的 时 候 再 次 成 为 受害 者 。 





5.8 小 结 


当 多 进程 或 多 线程 控制 计算 时 ， 并 行 控制 是 必要 的 。 没 有 并 行 控 制 ， 应 用 就 不 能 完全 利 
用 分 布 式 或 并 行 环 境 中 的 资源 。 本 章 已 经 讨论 了 并 行 控制 得 益 于 硬件 、 操 作 系统 和 应 用 开发 
语言 之 间 的 协作 ， 表 5-1 对 其 做 了 总 结 。 最 流行 的 现代 语言 提供 了 支持 互 斥 和 访问 临界 区 的 
一 些 机 制 ， 给 出 的 方法 通常 能 用 于 任何 多 线程 应 用 。 附 录 中 的 外 科 手 术 调 度 程序 提供 了 一 个 
使 用 并 发 控制 的 多 线程 应 用 的 范例 。 


R51 硬件 、 系 统 和 语言 对 并 发 支持 的 总 结 








支持 程度 提供 的 工具 
硬件 原子 操作 
循环 检查 锁 
互 斥 体 硬 件 操 作 
高 速 缓存 并 发 控制 


系统 支持 使 用 硬件 支持 的 系统 库 
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支持 程度 提供 的 工具 
系统 支持 多 线程 应 用 的 并 发 
锁 管 理 器 
令 牌 传递 互 斥 

语言 支持 信号 量 





使 用 系统 库 进 行 互 斥 体操 作 


本 章 还 讨论 了 在 访问 共享 数据 中 允许 互 斥 的 一 个 潜在 问题 一 一 死 锁 。 在 所 有 PAID 方法 
中 ， 检 测 最 受 欢迎 且 最 可 行 。 死 锁 检 测 通常 很 难 ， 资 源 越 多 ， 则 问题 越 复杂 。 经 常 的 网 络 延 
迟 令 “ 挂 起 ”和 “ 慢 速 ”很 难 区 分 ， 也 许 这 就 是 忽略 算法 的 魅力 ! 如 果 不 忽略 分 布 式 环境 中 
的 问题 ， 检 测 的 探测 方法 也 许 就 是 目前 为 止 最 流行 和 最 优雅 的 方法 了 。 


5.9 参考 文献 


关于 并 发 控制 的 综合 资料 可 在 许多 介绍 操作 系统 的 书 中 找到 。 利 用 并 发 控制 编程 的 资料 
包括 【Cha97，Cou98，DsDe94，DeDe98 和 RoRo96]。 与 本 章 内 容 相关 的 另外 一 些 传统 的 研究 
论文 包括 [AgAb91, Bri75, CaRo83, CMH83, Dij65, Fu97, Hoa74, Joh95, JoHa97, Kna87, 
RiAg81, Sin97 和 Tho79], 

SUN Microsystems 网 站 包括 了 使 用 并 发 线程 控制 的 编程 范例 ， 这 些 例 子 可 以 用 作 模 板 ， 
网 址 是 http: //www. sun. com/workshop/sig/threads/Berg-Lewis/examples.hinl, A+, Bl BPS 
出 的 网 址 也 是 寻找 并 行 控制 内 容 的 最 佳 网 址 。 


习题 


5.1 互 斥 对 于 保护 共 说 数据 是 必需 的 。 列 出 三 种 需要 互 斥 的 数据 访问 应 用 。 

5.2 数据 互 斥 能 够 用 于 不 同 的 粒度 层次 。 需 要 保护 的 数据 单位 可 以 是 单个 的 数据 、 单 
个 的 记录 或 一 个 记录 集 。 讨 论 不 同 的 粒度 层次 的 优点 和 缺点 ， 并 给 出 实例 。 

5.3 退出 一 个 临界 区 时 意外 的 信号 量 lower 操作 是 常见 的 编程 错误 。 请 描述 一 个 对 信 
号 量 raise 和 lower 操作 的 可 能 的 改变 方法 ,该 方法 可 以 避免 该 问题 。 

5.4 假设 有 一 个 应 用 允许 对 进程 分 配 优先 级 。 这 些 优先 级 将 用 于 决定 在 多 个 进程 处 于 
阻塞 状态 时 哪个 进程 接收 一 个 信和 号 量 的 raise 操作 。 这 种 方案 能 通过 三 点 测试 
吗 ? 请 解释 你 的 答案 和 必需 的 假设 条 件 。 

5.5 请 描述 一 个 替代 人 忙 等 待 的 方法 ， 并 分 析 此 方法 的 优 缺 点 。 

5.6 在 第 2 章 中 我 们 学 习 了 用 轮 询 来 确定 调度 。 考 虑 一 个 使 用 锁 互 斥 的 方案 。 该 方案 
中 使 用 一 个 轮 询 其 守护 资源 的 用 户 的 连续 循环 。 当 一 个 进程 被 轮 询 ， 它 可 能 接受 
锁定 该 资源 的 机 会 ， 或 者 放弃 直到 下 次 被 轮 询 。 请 根据 三 点 测试 要 求 简 要 评价 一 
下 这 种 方案 。 同 时 描述 这 种 方案 的 长 处 和 短处 。 

5.7 ”请问 在 集中 式 的 锁 管理 系统 中 如 果 不 使 用 “Queued” 的 消息 ,会 引起 什么 潜在 的 
问题 ? 
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5.8 


5.9 


当 使 用 一 个 集中 式 的 锁 管理 器 时 ， 如 果 一 个 进程 被 授权 访问 它 的 临界 区 后 死亡 ， 
会 发 生 什么 样 的 问题 ?并 请 提出 避免 此 问题 的 方案 。 

课程 注册 是 所 有 学 生 都 经 历 过 的 事情 。 对 于 某 门 指定 的 课程 ， 只 有 有 限 数目 的 空 
位 。 每 门 课 注册 的 学 生 数 量 都 不 允许 超过 所 拥有 的 空位 数目 。 另 外 ， 如 果 只 允许 
一 个 进程 访问 注册 学 生 所 需要 的 数据 ， 那 么 注册 过 程 将 顺利 进行 。 因 此 ， 和 每 门 
课程 有 关 的 数据 必须 通过 并 发 控制 来 保护 。 请 编写 一 个 程序 来 实现 课程 编排 。 你 
必须 考虑 该 程序 的 多 个 副本 能 运行 ， 并 且 这 些 副 本 访问 相同 的 数据 。 你 也 可 以 假 
定 你 被 世界 上 最 小 的 大 学 雇用 ， 该 大 学 只 有 一 门 课程 。 彻 底 地 测试 你 的 程序 ， 选 
择 以 下 方法 中 的 一 种 实现 。 

选项 A; 用 信号 量 实现 你 的 方案 。 

选项 B: 用 管 程 实现 你 的 方案 。 

选项 C: 用 锁 实 沈 你 的 方案 。 





5.10 自动 柜员 机 是 日 常生 活 中 的 一 部 分 。 请 用 一 个 模拟 程序 来 实现 一 个 简单 的 自动 柜 


员 机 。 确 保 使 用 一 种 并 发 控制 机 制 来 保持 账户 平衡 ， 因 为 可 能 有 多 人 拥有 对 一 个 
指定 账号 的 存 取 卡 。 你 的 方案 必须 着 重 考虑 并 发 控制 问题 ， 你 可 以 选用 以 下 一 种 
方法 来 实现 。 

选项 A， 用 信号 量 实 现 你 的 方案 。 

选项 B: 用 管 程 实现 你 的 方案 。 

选项 C: 用 锁 实 现 你 的 方案 。 
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第 6 章 基于 对 象 的 操作 系统 


基于 对 象 技 术 已 经 出 现在 包括 操作 系统 在 内 的 计算 机 科学 的 各 个 方面 。 在 这 一 章 里 , 我 
们 将 介绍 对 象 及 其 相关 的 术语 (6.1 节 )。 通 过 详细 讨论 基于 对 象 的 操作 系统 Clouds 来 分 析 
对 象 如 何 运用 到 操作 系统 中 ， 特 别 是 6.2 节 展 示 了 Clouds 是 怎样 实现 对 象 、 线 程 ， 以 及 它 对 
存储 系统 全 面 的 设计 。 在 6.3 节 我 们 将 讨论 Chorus 的 面向 对 象 子 系统 COOL 的 体系 结构 。 
6.4 节 介绍 Amoeba， 这 主要 集中 于 它 在 标识 、 保 护 和 通信 方面 对 对 象 的 处 理 。 两 个 主要 的 对 
象 模型 在 6.5 节 和 6.6 节 讨 论 。6.5 节 特 别 详细 介绍 分 布 式 组 件 对 象 模型 (DCOM) ， 这 个 模 
型 最 初 由 微软 提出 的 ， 但 目前 由 一 个 独立 的 机 构 管理 ， 并 对 所 有 的 UNIX 和 Windows 平台 是 
可 用 的 。6.6 节 介绍 一 个 流行 的 基于 对 象 的 标准 一 一 称 为 公共 对 象 请 求 代 理 程 序 体系 结构 
(CORBA)。 


6.1 对 象 介绍 


操作 系统 是 一 个 程序 ， 通 常 由 一 般 的 程序 语言 如 C 和 C++ 来 编写 。 虽 然 对 象 出 现在 计 
算 机 科学 的 每 一 个 方面 ， 但 是 对 象 及 其 相关 术语 还 没有 一 个 大 家 都 认可 的 、 严 格 的、 一 致 的 
定义 。 本 节 我 们 重点 讨论 已 广泛 接受 的 定义 。6.1.1 节 介 绍 对 象 的 常见 定义 ，6.1.2 节 对 基 
于 对 象 系统 的 优点 进行 讨论 。 


6.1.1 对 象 定义 


对 象 是 一 个 如 图 6-1 措 述 的 封装 所 有 相关 服务 和 数据 
的 抽象 。 将 对 象 服务 定义 为 函数 ， 在 基于 对 象 系统 中 函 © 
数据 





数 也 称 为 方法 或 成 员 函 数 。 在 本 章 中 我 们 使 用 术语 方法 

(method)。 方 法 不 能 被 独立 地 访问 ， 只 能 通过 它们 的 对 象 

来 访问 ， 若 没有 对 象 方 污 就 毫 无 意义 。 以 walking 为 例 ， 函数 

walking 意味 着 什么 ”如果 我 们 对 此 作 进 一 步 的 描述 ， 如 OOO 

一 个 人 walking 或 一 条 狗 walking, 那么 walking 就 有 了 某 种 OOO 

意义 。 方 法 只 有 依附 于 它 的 拥有 者 一 一 对 象 才 有 意义 。 

当 客 户 方 对 对 象 发 出 请 求 (request) 时 方法 就 被 访问 了 ， 

这 样 对 象 服务 请 求 来 自 于 客户 方 。 请 求 能 通过 参量 接受 图 6-1 一 个 对 象 

信息 并 且 可 以 返回 结果 。 被 一 个 特定 对 象 执行 的 方法 的 完整 集合 定义 了 该 对 象 的 行为 。 例 
如 ,一 个 人 的 行为 是 所 有 的 “方法 ”如 走 、 讲 、 唱 、 低 语 、 呼 喊 、 思 考 、 吃 、 喝 、 睡 、 跑 、 
坐 、 跳 等 的 集合 。 

在 基于 对 象 系统 中 通常 允许 方法 有 多 种 定义 ， 只 要 调用 中 的 参数 与 定义 了 的 方法 匹配 ， 
允许 出 现实 际 的 行为 由 请 求 中 的 参数 来 决定 的 通用 请 求 。 当 允许 有 多 个 方法 例 示 时 ， 方 法 例 
示 常 称 为 构造 器 〈constructor)。 同 时 允许 方法 的 多 个 定义 通常 称 为 函数 重 载 (function over- 
loading) ， 在 第 3 章 详细 说 明 3.4 中 有 相关 的 便 子 ， 在 那个 Java 语言 的 例子 中 对 于 套 接 字 对 象 
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就 有 多 个 含有 某 些 默认 参数 值 的 构造 函数 。 

基于 对 象 系统 常常 允许 一 个 对 象 的 多 个 实例 。 这 种 特点 使 得 对 象 可 以 共享 一 个 共同 的 实 
现 。 例 如 ， 如 果 我 们 有 一 个 person TR, 我们 可 以 有 两 个 该 对 象 的 独立 实例 ， 如 Steven 和 
Sue。 一 个 对 象 的 抽象 定义 通常 称 为 类 (class)。 当 使 用 这 个 术语 时 ， 它 的 实例 就 称 为 对 象 。 
程序 类 的 实例 在 Java 和 CORBA 中 经 常 被 称 为 服务 工具 。 

此 外 ， 对 象 可 以 通过 继承 (inheritance) 来 部 分 地 共享 实现 细节 。 继 承 允 许 对 象 用 现 有 
的 对 象 来 定义 ， 当 允许 继承 时 ， 基 于 对 象 的 系统 称 为 面向 对 象 系统 。 某 些 实现 允许 对 象 可 从 
多 个 对 象 继承 特性 ， 这 种 类 型 的 继承 称 为 多 重 继承 。 


6.1.2 对 象 的 评价 


对 象 有 许多 优点 。 使 用 对 象 最 大 的 优点 之 一 是 数据 抽象 和 封装 。 这 种 封装 促进 程序 的 模 
块 化 ， 并 使 之 有 清晰 的 接口 。 此 外 ， 对 象 使 得 程序 有 很 强 的 作用 域 及 类 型 检查 ， 通 过 禁止 不 
恰当 的 数据 操作 和 对 象 动作 相应 地 增强 了 安全 性 。 在 基于 对 象 系统 中 ， 分 布 式 的 迁移 单位 和 
在 共享 存储 器 中 使 用 的 单位 是 对 象 。 在 面向 对 象 系统 中 继承 特性 使 得 可 以 进行 增 量 设 计 和 开 
发 。 详 细 说 明 6.1 介绍 了 一 个 纯 对 象 模型 的 变型 一 一 面向 主题 编程 (SOP). SOP 在 大 型 软件 
系统 〈 包 括 分 布 式 操作 系统 和 应 用 ) 中 有 着 良好 的 前 景 。 


详细 说 明 6.1 
面向 主题 编程 (SOP) 













玉 过 ， 这 其 中 包括 [Ha0s93，DeHa95]， 并 在 
应 用 进行 了 点 评 。IBM 公司 T. J. Watson 研究 
而 设计 了 SOP, AMAR DH pee 
| 林 来 编程 。 传 统 的 面向 对 象 开发 模式 与 SOP 的 区 别 是 当 这 些 开发 小 
Ashokan LS, Ag ae ele tees 在 














次 LOBDRNTCAGHMERAMTA UR 
+, TRENCHES. 这 样 一 旦 所 有 的 域 






ARR init Lt ine ak Lana Lda bis kama 
eR, 不 同 的 应 用 可 能 需要 不 同 接口 。 我 们 不 用 考虑 其 他 的 应 用 ， 因 为 它们 存在 于 我 们 的 
空间 和 时 间 之 外 。 使 用 SOP 仍然 必须 确定 对 象 但 也 只 限于 本 领 城中 的 对 象 ， 这 些 对 象 无 
需 知 道 系统 中 的 所 有 对 象 ( 即 那些 主题 域 以 外 的 对 象 ) 。 此 外 只 需 掌握 对 象 的 上 下 文 环境 
中 所 支持 的 消息 即 可 。 这 种 行为 由 对 象 来 提供 ， 行 为 可 以 由 应 用 程序 开发 人 员 添 加 到 对 
象 中 。 因 此 ， 应 用 程序 开发 人 员 与 “类 主人 ”之 间 的 通信 就 大 大 减少 了 [OaHa95]。 
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“这 种 系统 类 型 的 意义 是 每 个 未 地 域 不 受 全 局 城 改变 的 影 影响 。 这 样 该 类 型 的 模型 能 增 
人 
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虽然 使 用 对 象 的 优点 得 到 了 认可 ， 但 是 面向 对 象 技 术 在 高 级 环境 中 还 存在 一 些 争 议 。 使 
用 对 象 有 缺点 吗 ? 是 的 ， 尽管 大 多 数 与 面向 对 象 系统 而 不 是 与 基于 对 象 系统 有 关 。 对 象 继承 
特别 是 多 重 继承 难于 管理 。 任 何 对 父 对 象 所 做 的 改变 将 影响 从 它 派生 出 来 的 子 对 象 ， 而 且 对 
带 有 多 重 继承 的 大 型 系统 的 设计 和 管理 难于 表示 和 编写 文档 。 此 外 ， 对 象 的 行为 依赖 于 派生 
它 的 父 对 象 的 行为 。 为 了 理解 对 象 的 行为 通常 必须 理解 父 对 象 的 行为 ， 这 意味 着 要 对 整个 系 
统 有 着 完整 的 认识 〈 这 是 在 大 型 分 布 式 系统 中 不 愿意 看 到 的 )。 但 是 操作 系统 常常 由 受 控 的 
一 组 人 来 开发 ， 而 且 基于 对 象 操作 系统 并 不 是 要 求 在 系统 上 开发 的 应 用 程序 均 应 采用 基于 对 
象 方法 。 基 于 对 象 的 系统 和 语言 一 般 要 慢 一 些 ， 在 有 网 络 延迟 的 分 布 式 环境 中 或 在 有 严格 时 
间 限 制 的 实时 系统 中 ， 采 用 已 知 的 较 慢 的 技术 通常 不 令 人 满意 。 尽 管 有 以 上 缺点 ， 但 也 存在 
一 些 成 功 设 计 的 基于 对 象 和 面向 对 象 的 操作 系统 。 


6.2 Clouds 对 象 方法 


Clouds 是 一 个 基于 对 象 的 分 布 式 操 作 系 统 ， 它 由 佐治亚 理工 学 院 开发 ， 在 [DLAR91 ] 
中 有 相关 的 讨论 。Clouds 是 一 个 带 有 本 机 内 核 〈 即 内 核 不 运行 于 其 他 操作 系统 之 上 ) 的 通用 
操作 系统 。 内 核 称 为 Ras ， 是 一 个 分 层 的 内 校 而 不 是 微 内 核 。Clouds 可 应 用 于 集中 式 或 分 布 
式 应 用 中 ， 而 且 这 些 应 用 可 以 由 面向 对 象 或 非 面 向 对 象 语言 编写 。6.2.1 节 将 讨论 Clouds 的 
对 象 ， 在 6.2.2 节 中 介绍 Clouds 的 线程 ， 最 后 在 6.2.3 节 中 对 Clouds 的 存储 系统 进行 讨论 。 


6.2.1 Clouds 的 对 象 


Clouds 基于 流行 的 面向 对 象 的 编程 模型 及 对 象 线程 模型 。 在 本 节 中 我 们 将 介绍 Clouds 的 
对 象 。 每 个 Clouds 对 象 由 数据 和 方法 组 成 。 每 个 完整 的 Clouds 对 象 是 持久 的 并 位 于 一 个 虚拟 
地 址 空间 中 。 并 且 其 对 象 不 允许 多 重 继承 。 对 象 通过 消息 来 进行 通信 ， 相 应 地 引起 一 个 方法 
的 执行 。 这 种 方法 可 能 会 改变 数据 的 值 或 使 另外 的 对 象 接 收 到 消息 。 当 调用 的 方法 执行 完 
毕 ， 通 过 返回 参数 值 使 得 对 象 能 对 发 送 者 的 消息 做 出 回应 。 消 息 由 线程 的 执行 而 产生 ， 这 也 
就 是 模型 取 名 的 原因 。 这 些 消 息 通 过 调用 带 有 输 人 参数 的 人 口 点 来 传 给 对 象 ， 参 数 严格 限于 
使 用 数据 而 非 数据 的 地 址 。 所 有 地 址 都 没有 多 少 意 义 ， 因 为 它们 对 于 一 个 已 知 对 象 来 说 是 相 
对 性 的 。 一 个 用 户 能 通过 指定 对 象 、 人 口 点 及 Clouds 的 Shell 参数 来 调用 Clouds 的 对 象 。 

Clouds 的 对 象 被 认为 是 “重量 级 的 ”， 它 最 适合 于 大 粒度 的 程序 。Clouds 对 象 又 是 被 动 
的 ， 因 为 它 不 含有 进程 或 线程 。 具 体 地 说 ， 一 个 Clouds 对 象 由 以 下 项 组 成 : 

用 户 定义 的 代码 。 

4 持久 数据 。 


加 ”Ra 是 埃及 的 太阳 神 。 


POF KRFIMTROREAA 89 





4 用 于 临时 内 存 分 配 的 易 失 堆 。 

4 用 于 分 配 内 存 的 持久 堆 。 

在 物理 上 所 有 的 对 象 都 存放 于 数据 服务 器 中 ， 但 是 Clouds 提供 了 位 置 透明 性 ， 这 样 所 有 
数据 都 可 以 从 任何 系统 服务 器 中 访问 。 由 于 每 个 对 象 都 有 一 个 惟一 的 全 局 性 系统 级 名 字 ， 从 
而 使 透明 性 得 到 了 进一步 的 增强 。 一 个 用 户 不 用 对 对 象 的 系统 名 字 负 责 ， 他 可 以 赋予 对 象 任 
何 名 字 而 由 名 字 服 务 将 该 名 字 翻 译 成 惟一 的 系统 名 字 。 

Clouds 通过 让 对 象 支持 存储 和 线程 的 抽象 来 维护 计算 和 存储 的 正 交 性 ， 以 解除 这 两 者 的 
关联 。Clouds 的 对 象 线程 模型 的 实现 使 得 可 以 对 IO、 进 程 间 通 信 、 信 息 共享 、 长 期 存储 以 
及 原子 的 和 可 靠 的 计算 进行 统一 的 处 理 。 


6.2.2 Clouds 的 线程 


线程 在 对 象 之 间 迁 移 并 从 每 个 对 象 
的 入 口 点 开始 执行 。 当 线程 迁移 时 ， 它 
们 执行 对 象 内 的 代码 ， 这 样 各 种 线程 代 
表 了 所 有 用 户 在 每 个 线程 中 的 活动 ， 它 
表示 了 程序 执行 的 逻辑 路 径 。 一 个 线程 
可 以 由 两 种 方式 来 创建 由 用 户 或 由 程 
序 来 创建 。Clouds 线程 不 像 第 2 章 所 述 
的 线程 那样 绑 定 于 单 地 址 空间 。 当 一 个 
对 象 的 执行 产生 对 另 一 个 对 象 的 调用 
时 ， 线 程 暂时 地 离开 该 对 象 而 进入 新 调 
用 的 对 象 。 在 调用 的 对 象 中 执行 完毕 
后 ， 线 程 才 返 回 到 原来 的 对 象 中 。 对 象 
调用 可 以 是 递归 的 或 嵌 套 的 ， 线 程 只 有 
在 它 完 全 执行 完整 个 操作 时 才 终 止 ， 如 
图 6-2 所 示 。 

线程 允许 在 一 个 对 象 内 并 发 执行 ， 
这 样 可 以 在 一 个 对 象 中 同时 有 多 个 线 
程 。 当 多 个 线程 存在 于 一 个 对 象 中 时 ， 
它们 共享 对 象 的 数据 及 对 象 的 地 址 空 
间 。Clouds 使 用 锁 和 信号 最 来 支持 对 象 图 6-2 Clouds 的 线程 执行 
内 的 并 发 控制 。 所 有 的 对 象 都 必须 编写 成 支持 并 发 执行 的 。 当 在 执行 过 程 中 创建 并 发 线程 时 
就 会 指定 并 发 的 实际 级 别 。 
6.2.3 Clouds 内 存 存储 

在 传统 的 系统 中 ， 持 入 存储 用 于 存放 文件 ， 而 与 进程 相关 联 的 存储 器 中 的 信息 是 易 失 
的 。Clouds 的 对 象 用 来 统一 持久 存储 和 内 存 ， 以 创建 一 个 完整 的 、 持 久 的 地 址 空间 。 该 机 制 


不 支持 消息 和 文件 但 可 以 模拟 。 对 于 共享 数据 的 对 象 ， 则 必须 调用 数据 所 在 的 对 象 。 从 内 存 
管理 器 的 角度 来 看 ，Clouds 的 对 象 由 映射 到 虚拟 内 存 的 多 个 段 组 成 。 所 有 的 段 都 有 若干 物理 


线程 开始 线程 结束 
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页 大 小 ， 由 称 作 分 区 的 系统 对 象 来 维护 这 些 段 。 分 区 负责 段 的 创建 、 维 护 和 存储 。 一 个 段 属 
于 创建 它 的 分 区 。 


6.3 Chorus V3 和 COOL V2 


Chorus V3 (版 本 3) 是 一 个 分 布 式 实时 微 内 核 操 作 系 统 ， 在 [LJP93]」 中 有 该 系统 的 相关 
讨论 。 它 最 初 由 法 国 NRA 研究 所 作为 一 个 研究 项 目 进行 开发 。 从 那 时 起 ， 它 慢 慢 地 进化 成 
一 个 遵循 CORBA 标准 的 商业 化 产品 系列 。 具 体 地 说 ，Chorus V3 包含 一 个 面向 对 象 子 系统 ， 
这 个 子 系统 称 为 Chorus 面向 对 象 层 (Chorus Object - Oriented Layer, COOL) 它 现在 是 遵循 
CORBA 标准 的 分 布 式 实时 商业 化 产品 Chorus/COOL ORB 的 一 部 分 。 在 第 3 版 作为 商业 化 产品 
发 布 后 ，Chorus 于 1997 年 下 半年 由 Sun 公司 收购 。 从 那 时 起 Chorus 就 作为 Sun 公司 JavaOS 的 
基础 ， 并 由 Sun 公司 单独 冠 以 ChorusOs 的 名 字 在 市 场 上 发 售 。 

COOL 子 系统 运行 在 Chons MARZE, Chons V3 的 一 个 重要 目标 是 在 进程 控制 和 远程 
通信 方面 的 系统 响应 ， 这 对 于 实现 分 布 式 实 时 执行 内 核 是 非常 关键 的 。 

COOL 对 象 由 两 个 段 组 成 ， 分 别 是 数据 段 和 代码 段 。 这 个 代码 段 作为 方法 的 对 象 方法 存 
放 在 代码 段 中 ， 并 由 所 有 同一 对 象 的 实例 共享 。 

在 本 节 中 ， 我 们 讨论 COOL V2 (版 本 2), COOL 体系 结构 由 以 下 三 部 分 组 成 。 

1. 基层 。 

2. 通用 运行 时 系统 。 

3. 语言 运行 时 系统 。 

用 户 程序 运行 于 语言 运行 时 系统 之 上 ， 我 们 将 一 一 讨论 这 些 层 。 


6.3.1 基层 COOL 内 存 管理 


基层 为 用 户 进 程 提供 一 组 服务 ， 它 跨越 整个 系统 并 延伸 到 (基于 进程 的 ) 微 内 核 。 该 层 
提供 了 DSM 的 面向 对 象 的 等 价 系统 ， 并 支持 消息 发 送 。Chorus DSM 在 详细 说 明 4.4 中 讨论 。 
COOL 中 的 内 存 管 理 是 基于 集群 的 。 集 群 是 持久 的 ， 基 层 能 定位 非 活动 的 集群 。 每 个 集群 是 
一 组 由 段 组 成 的 区 域 ， 集 群 的 成 员 通 常 是 属于 同一 个 类 的 相关 对 象 。 该 体系 结构 的 上 层 软件 
确定 实际 的 集群 的 分 配 ， 这 些 集群 映射 到 任意 的 地 址 空间 且 在 逻辑 上 是 一 组 虚拟 内 存 区 域 。 
分 布 式 虚拟 内 存 映 射 器 管理 虚拟 内 存 和 辅助 存储 器 之 间 的 关系 。 分 布 式 虚拟 地 址 空间 称 为 上 
下 文 空间 。 上 下 文 空间 允许 集群 共享 属于 某 特定 上 下 文 空间 的 执行 线程 。 可 以 改变 上 下 文 空 
间 的 实际 映射 的 绑 定 ， 这 样 在 需要 的 时 候 能 重新 映射 到 另 一 组 地 址 空间 。 这 种 方法 允许 一 个 
集群 同时 映射 到 多 个 上 下 文 室 间 ， 而 无 需 所 有 的 上 下 文 空间 都 映射 到 物理 地 址 中 。 这 样 当前 
未 利用 的 上 下 文 空间 可 以 保持 为 未 映射 状态 。 
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上 下 文 空间 1， 2 和 3。 PETRA LT LEM IAB AAR, eS eM 
HAA BN AE: 上 下 文 空间 2 和 3。 


节点 A 
上 下 文 空间 | 上 下 文 空间 2 

















6.3.2 通用 运行 时 系统 层 ，COOL 对 象 


COOL 对 象 是 在 通用 运行 时 系统 层 中 实现 的 ， 由 状态 和 一 组 方法 组 成 。 这 些 对 象 为 应 用 
程序 开发 提供 服务 。 有 两 种 对 象 引 用 可 用 : 第 一 种 是 领域 范围 内 持久 的 和 全 局 惟一 的 引用 ; 
第 二 种 是 在 对 象 的 当前 上 下 文 空间 中 有 效 的 语言 引用 ， 是 对 虚拟 内 存 的 引用 。 

通用 运行 时 系统 层 的 一 个 组 件 是 对 象 管理 组 件 ， 对 象 管理 包括 以 下 操作 : 

4 对 象 创建 。 

4 动态 链接 。 

4 动态 加 载 。 

4 透明 调用 (映射 到 上 下 文 空 间 和 辅助 存储 节点 )。 

该 层 支持 一 个 执行 模型 和 一 个 语言 级 的 模型 ， 执 行 模型 将 对 象 活 动 映射 到 Chorus 的 线 
程 和 作业 中 。 当 一 个 对 象 天 始 动 作 时 线程 开始 执行 ， 线 程 由 下 层 的 微 内 核 来 支持 ， 作 业 用 来 
对 分 布 式 执 行进 行 建 模 。 每 个 作业 代表 了 单个 的 分 布 式 应 用 ， 具 体 地 说 ， 作 业 组 织 一 组 上 下 
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文 空间 ， 如 详细 说 明 6.2 折 述 每 个 上 下 文 空间 能 支持 数 个 集群 ， 而 且 每 一 个 集群 能 包含 多 个 
对 象 。 此 外 ， 集 群 能 支持 并 发 活动 。 并 发 在 本 地 由 同步 原 语 支 持 ， 在 非 本 地 的 并 发 由 分 布 式 
令 牌 管理 器 支持 。 本 地 的 同步 原 语 包括 信号 量 和 多 读者 / 单 写 者 的 锁 ， 详 见 第 5 章 。 

语言 层 的 模型 设计 成 支持 不 同 语言 模型 的 多 种 语义 ， 具 体 地 说 ， 部 分 实现 了 ORB (对 
象 请 求 代理 )。 这 个 模型 支持 持久 性 、 调 用 及 地 址 空间 的 重 映射 。 一 般 来 说 ， 它 人 允许 该 层 在 
分 布 式 环境 中 为 多 种 语言 以 语言 特有 的 方式 运作 。 利 用 称 为 接口 对 象 的 代理 服务 可 将 本 地 的 
方法 调用 替代 为 远程 调用 。 这 种 代理 服务 用 打包 和 拆 包 参数 的 远程 过 程 调用 来 代替 语言 通信 
原 语 ， 它 允许 并 且 在 事实 上 实现 了 对 象 的 分 布 式 执行 。 


6.3.3 特定 语言 运行 时 系统 层 


该 层 利 用 预 处 理 器 来 负责 将 特定 语言 的 对 象 映射 到 通用 运行 时 模型 ， 这 样 就 实现 了 如 
6.6.1 节 所 述 的 ORB 的 IDL 【接口 定义 语言 )。 程 序 员 可 以 使 用 通用 语言 COOL++ (CEC 
的 一 个 变种 )， 或 用 标准 C++ 编程 ， 并 显 式 地 利用 通用 运行 时 系统 层 的 系统 调用 。 使 用 
COOL++ 的 主要 优点 是 由 于 它 遵循 CORBA( 见 6.6 节 ) 的 规范 ， 而 成 为 一 种 透明 的 编程 
模型 。 


6.4 Amoeba 


Amoeba 是 基于 处 理 器 池 的 模型 ， 允 许 处 理 器 数目 动态 变化 。Amoeba 的 进程 管理 和 存储 
管理 已 分 别 在 第 2 章 和 第 4 章 的 详细 说 明 中 作 了 介绍 ， 在 本 节 中 ， 我 们 集中 讨论 Amoeba 的 
对 象 技术 。Amoeba 的 对 象 可 以 是 客户 机 对 象 或 服务 器 对 象 ， 对 象 允许 多 重 继承 。 我 们 在 
6.4.1 节 中 讨论 Amoeba 对 象 的 标识 和 保护 ， 在 6.4.2 讨论 对 象 通信 。 要 了 解 Amoeba 系统 的 
更 多 信息 ， 请 参阅 [MVTVV90, TaAn90，Tan95] 。 


6.4.1 Amoeba 对 象 的 标识 和 保护 


对 象 的 标识 是 基于 由 以 下 四 个 基本 字段 组 成 的 结构 化 的 权能 : 

1， 服 务 器 端口 。 

2， 对 象 编号 。 

3， 权 限 字 上段。 

4， 校 验 字段 。 

服务 器 端口 是 对 管理 特定 对 象 的 服务 器 进程 的 编码 表示 。 同 Clouds 的 对 象 一 样 ，Amoeba 
的 对 象 有 一 个 随机 选择 的 惟一 名 字 。 该 名 字 以 对 象 编号 来 表示 ， 这 个 编号 由 目录 服务 映射 为 
ASCII 名 字 。 可 以 对 对 象 执行 的 操作 〈 如 读 、 写 、 执 行 ) 由 权限 字段 的 内 容 来 规定 。 最 后 ， 
权能 也 负责 对 象 的 保护 ， 这 由 核验 字段 来 实现 。 校 验 字 段 通过 提供 加 密 保 护 来 预防 他 人 猜测 
对 象 的 权能 ， 这 种 保护 也 允许 权能 管理 以 用 户 进程 在 内 核 外 出 现 的 情况 。 


6.4.2 Amoeba 的 对 象 通 信 


Amoeba 的 对 象 通 信 是 通过 远程 过 程 〈 对 象 ) 调用 来 实现 的 。 总 的 来 说 ， 有 三 种 类 型 的 
远程 过 程 调用 原 语 : 


1. do_operation, 
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2. get_request. 
3. send replyo 


do_operation 原 语 由 客户 机 线程 发 出 ， 用 来 从 对 象 管理 服务 中 发 送 请 求 ， 要 求 对 象 执 
行 操作 。 如 果 服 务 器 愿意 在 某 特定 端口 接受 远程 过 程 调 用 ， 它 就 利用 get_ request 原 语 来 
将 此 通告 给 系统 。 当 服务 器 区 到 一 个 do_opera-ion 请 求 时 ， 服 务 器 就 执行 该 请 求 并 通过 
send_reply 将 应 管 返回 给 客户 机 ， 见 图 6-4。 同 大 多 数 操作 系统 一 样 ， 这 些 基 本 的 通信 原 
语 通过 由 其 他 的 类 继承 使 得 在 同一 层 中 功能 进一步 增强 。 

消息 在 对 象 的 端口 被 接收 。 客户 机 
端口 是 一 个 48 位 的 数字 ， 只 有 
服务 及 其 客户 机 知道 。 公 共 服 务 
《如 文件 系统 ) 通告 它们 的 端口 ， 

而 私有 服务 端口 则 保密 ， 因 为 知 

道 了 端口 号 就 意味 着 允许 使 用 服 

务 。 为 了 能 够 让 所 希望 的 请 求 使 

用 服务 ， 除 了 端口 号 外 客户 方 还 
必须 拥有 正确 的 权能 。 因 此 ， 通 

信 机 制 包括 安全 措施 ， 端 口 保护 

对 服务 器 的 访问 ， 以 及 权能 保护 t-get request 
对 象 。 此 外 服务 器 能 使 用 非 对 称 

加 密 〈 见 第 11 章 ) 来 进一步 增 Med Amoeba BS Sts 

强 安全 性 。 

第 3 章 曾 讲 过 远程 调用 需要 参数 打包 。 在 Amoeba 中 参数 打包 (和 拆 包 ) 由 接口 语言 编 
译 器 来 完成 。 在 打包 完 一 个 请 求 后 ，4Amoeba 的 传输 机 制 就 被 调用 来 发 送 消息 。 消 息 由 一 个 
消息 头 和 一 个 缓冲 区 组 成 ， 缓 冲 区 通常 含有 数据 而 消息 头 则 有 固定 的 格式 。 消 息 头 中 包括 地 
址 信息 、 操 作 码 和 其 他 依赖 消息 类 型 的 信息 。 操 作 码 用 来 选择 服务 特定 消息 的 对 象 。 


6.5 分 布 式 组 件 对 象 模型 


组 件 对 象 模型 (COM) 曾经 是 基本 的 Microsoft 组 件 对 象 模 型 。 用 于 分 布 式 COM 的 分 布 
式 组 件 对 象 模型 (DCOM) 为 分 布 式 对 象 计算 提供 了 一 种 编程 模型 、 执 行 代 码 级 的 标准 以 及 
互 操作 标准 。 自 从 Windows NT4.0 发 布 以 来 ，DCOM 就 可 用 ， 它 拥有 用 于 Windows 95 的 版 本 
并 得 到 Microsoft Intemet Explorer 4.0 及 Windows 98 支持 ， 从 一 个 名 叫 Software AG 的 公司 可 得 
到 能 应 用 于 所 有 主要 的 UN 区 平台 的 DCOM 产品 。 虽 然 开始 时 由 Microsoft 发 起 ， 但 现在 COM 
和 DCOM 已 不 再 为 Microsoft 所 专 有 ， 而 是 由 一 个 独立 的 ActiveX 协会 来 负责 对 它们 的 管理 。 
本 节 中 的 内 容 是 从 Microsoft 的 NT 白皮书 集 [Micrz98] 中 摘录 下 来 的 。 

基本 的 COM 模型 拥有 人 允许 单独 考虑 逻辑 单元 的 能 力 。 它 也 允许 灵活 地 执行 代码 组 件 ， 
可 适应 不 同 的 配置 和 机 器 。COM 被 广泛 地 看 作 是 ActiveX 中 的 核心 技术 ， 任何 支 持 COM 组 件 
的 软件 工具 也 自动 地 支持 COM 的 分 布 式 扩展 一 一 DCOM。 有 四 种 对 DCOM 特别 有 用 的 Ac- 
tiveX 服务 器 框架 服务 : 拥有 回 滚 和 恢复 能 力 的 事务 ; 可 以 在 间 歌 性 不 可 访问 的 网 络 上 操作 
的 、 拥 有 可 靠 的 存储 - 转发 队列 的 排队 系统 ; 易于 与 基于 HTML 的 Intemet 应 用 集成 的 服务 








137 


138 


139 


A 分 布 式 操作 系统 : 原理 与 实践 








器 脚本 ; 对 旧 产 品系 统 的 访问 支持 。DCOM tt COM 更 进一步 ， 它 使 软件 组 件 通过 网 络 直接 
通信 。DCOM 的 一 些 突出 的 特点 是 ; 

4 传输 中 立 : DCOM 能 使 组 件 间 进 行 通信 而 无 论 它们 是 面向 连接 的 或 是 无 连接 的 ， 它 支 

持 TCP/IP, UDP/IP, IPX/SPX, Apple Talk 和 HTTP. l 

4 开放 式 技 术 : DCOM 是 一 种 开放 式 的 技术 ， 它 可 用 于 UNIX, Apple, Windows 及 某 些 遗 

留 环境 ， 但 它 还 是 最 常用 于 基于 Windows 的 环境 。 

4 通用 Web 浏览 器 和 服务 器 组 件 : 自从 DCOM 包括 ActiveX 及 ActiveX 组 件 以 来 ， 它 就 能 

嵌入 到 基于 浏览 器 的 应 用 程序 中 ，DCOM 使 支持 浏览 器 技术 的 分 布 式 Internet 应 用 成 为 

可 用 的 。 

4 安全 性 : DCOM 能 将 基于 认证 的 Internet 安全 机 制 ( 见 第 11 章 ) 集成 到 基于 标准 的 应 

用 中 。 

$$ 分布 式 计算 环境 “DCE) 的 RPC 机 制 的 扩展 : DCOM 对 DCE 的 RPC 机 制 进行 了 扩展 ， 

扩展 位 于 DCE 的 RPC 的 上 层 ， 它 也 是 建议 的 Internet 标准 的 一 个 主题 。 

基本 的 DCOM 体系 结构 将 应 用 设计 和 开发 成 能 自动 允许 其 将 来 进行 分 布 和 扩展 的 一 种 方 
式 。 一 般 来 说 ， 添 加 一 个 服务 器 到 系统 中 比 经 常 地 升级 系统 开销 更 少 和 更 加 实用 。 这 又 与 
DCOM 有 什么 关系 呢 ? 用 DCOM 设计 的 应 用 在 部 署 时 具有 内 在 的 灵活 性 ， 个 应 用 刚 开始 时 
可 能 作为 集中 式 解 决 方案 在 单个 服务 器 中 部 署 ， 将 来 对 应 用 的 需求 可 能 会 超过 服务 器 处 理 能 
A, 通常 就 需要 重 写 该 应 用 程序 或 将 服务 器 升级 。 对 于 DCOM 的 应 用 程序 ， 其 他 的 服务 器 可 
以 加 入 到 系统 中 并 使 不 同 的 组 件 在 新 加 入 的 服务 器 中 运行 。 这 样 就 极 大 地 增强 了 应 用 程序 的 
可 扩展 性 ， 并 极 有 可 能 减少 工程 维护 费用 ， 因 为 不 需要 修改 应 用 程序 。 应 用 的 实际 可 扩展 程 
度 依赖 于 应 用 程序 的 体系 结构 ， 当 然 如 果 应 用 程序 当初 未 进行 恰当 设计 ， 它 可 能 不 具有 
DCOM 的 这 方面 的 优点 。 

为 了 与 非 本 地 的 组 件 通信 ，DCOM 使 用 一 种 对 应 用 程序 完全 透明 的 进程 间 通 信 机 制 。 具 
体 地 说 ，DCOM 用 一 个 区 络 协议 来 代替 本 地 通信 ， 因 此 ，DCOM 为 应 用 提供 了 位 置 的 独立 性 
和 位 置 的 透明 性 。 


6.5.1 标记 


DCOM 中 的 实例 名 字 称 为 标记 《moniker)。 标 记 本 身 就 是 对 象 ， 它 有 着 极 大 的 灵活 性 。 
从 数据 库 名 字 到 服务 器 、 统 一 资源 定位 符 (URL) 以 及 超 文 本 标记 语言 (HIML) 页 面 都 是 
标记 ， 它 们 可 以 用 来 标识 对 象 的 实例 。 标 记 含 有 必要 的 信息 和 逻辑 以 定位 它 所 命名 的 对 象 当 
前 正在 运行 的 实例 。 一 个 命名 的 对 象 的 标准 接 日 称 为 Moniker， 这 个 [Moniker 接口 可 用 来 绑 
定 到 被 命名 的 对 象 实例 上 。 

一 般 来 说 ， 对 象 实例 命名 它 自己 。 在 命名 过 程 中 它们 创建 一 个 标记 对 象 ， 以 提供 给 有 兴 
趣 重 连接 到 它们 上 的 客户 方 ， 而 且 对 象 实例 将 它们 的 标记 对 象 登 记 到 COM 库 中 。 当 前 正在 
运行 的 标记 都 列 入 到 运行 对 象 表 (ROT) 中 ,标记 使 用 ROT 快速 找到 运行 中 的 对 象 实例 。 当 
一 个 标记 对 象 需要 绑 定 到 一 个 对 象 实例 时 ，ROT 努力 寻找 一 个 匹配 。 当 匹配 找到 时 就 返回 指 
向 存放 在 ROT 中 的 相应 活动 对 象 的 指针 。 如 杂 没 有 运行 实例 或 标记 没有 登记 ， 标 记 就 利用 
对 象 创建 机 制 来 创建 一 个 未 初始 化 的 实例 。 在 创建 时 标记 用 相应 的 机 制 存 储 该 对 象 的 状态 。 
这 个 完整 的 过 程 对 应 用 是 透明 的 。 
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标记 拥有 对 象 持久 状态 的 参考 信息 ， 这 种 信息 一 般 存 放 在 一 个 文件 或 数据 库 中 。 对 象 可 
以 向 标记 表明 当 存 放 这 种 状态 信息 时 应 激活 什么 。 这 样 如 果 对 象 运行 在 存放 该 数据 的 同一 个 
服务 器 上 ， 数 据 密集 型 操作 就 可 以 防止 潜在 的 性 能 瓶颈 。 如 果 多 个 客户 机 需要 访问 某 对 象 ， 
则 该 对 象 应 当 在 一 个 可 以 被 所 有 客户 机 访问 的 节点 上 执行 。 

标记 也 有 履 盖 它们 的 绑 定 操作 的 能 力 。 有 具体 地 说 ， 可 以 通过 编程 来 覆盖 标记 绪 定 操作 中 
要 用 到 的 远程 服务 器 的 名 字 。 这 通过 一 个 包含 在 标记 内 的 可 选 的 指向 COSERVERINFO 结构 
来 实现 。 这 个 结构 用 于 cocreateInstanceEx 结构 以 创建 对 象 实 例 。 

文件 标记 是 COM 的 一 部 分 ， 其 中 封装 了 用 于 对 象 实 例 化 的 文件 协议 。 它 可 以 用 于 将 
COM 文件 标记 映射 到 URL 文件 协议 , 访问 在 本 地 文件 系统 中 的 持久 数据 ， 将 文件 协议 初始 
化 以 访问 已 知 的 文件 及 作为 确认 存储 的 文件 类 型 的 检查 机 制 。URL 标记 封装 了 人 协议, 例 
如 http、fip 和 gopher。 


6.5.2 远程 方法 调用 


当 客 户 方 需要 调用 位 于 另 一 个 地 址 空间 中 的 对 象 时 ，DCOM 执行 远程 方法 调用 。 如 前 所 
R, DCOM 的 接口 描述 语言 (IDL) 是 构建 于 DCE RPC 标准 IDL 之 上 。 在 RPC 中 通常 将 所 有 
参数 信息 打包 到 一 个 标志 存储 缓冲 区 中 〈 见 第 3 章 ) ， 接 收 方 通过 参数 拆 包 过 程 重 新 创建 堆 
栈 内 容 来 重 构 参 数 信息 。 当 远程 方法 调用 返回 时 ， 任 何 返回 值 和 输出 参数 需要 再 次 从 本 地 堆 
栈 中 打包 然后 发 回 给 客户 方 ， 客 户 方 将 参数 拆 包 就 完成 了 一 次 完整 的 通信 过 程 。 客 户 方 执 行 
远程 方法 调用 的 代码 称 为 代理 ， 而 服务 器 方 的 代码 称 为 桩 程序 。 

为 外 一 个 未 包括 到 DCE RPC 中 的 数据 类 型 是 接口 指针 。 这 种 类 型 的 指针 可 以 作为 Co 
CreateInstance 的 返回 值 或 方法 调用 的 参数 出 现 。 为 了 处 理 这 种 新 的 数据 类 型 ， 创 建 了 能 
在 接口 的 所 有 方法 中 都 能 处 理 该 数据 类 型 的 代理 / 桩 程序 对 。 传 统 上 在 COM 和 DCOM 的 大 多 
数 领域 中 ， 对 接口 指针 的 打包 过 程 可 以 扩展 或 通过 使 用 定制 的 代理 / 桩 程序 对 来 覆 姜 。 


6.5.3 资源 回收 


用 来 控制 已 知 对 象 的 生命 周期 的 关键 机 制 是 引用 计数 。 一 个 对 象 的 引用 计数 通过 使 用 
AddRef 来 增加 ， 而 由 方法 Release 来 减少 。 和 希望 所 有 远程 客户 程序 正常 终止 并 执行 一 个 
Release 操作 是 不 现实 的 ， 因 此 使 用 Ping 机 制 。Ping 是 用 来 检测 客户 程序 非 正 常 终止 的 常 
用 机 制 。 每 个 引出 对 象 都 有 一 个 pingPeriod 时 间 值 和 numPingsToTimeout 计数 ， 这 些 值 
组 合 起 来 确定 了 称 为 “ping 周期 ”的 总 的 时 间 。 如 果 已 经 过 了 “ping 周期 ”时 间 而 没有 为 给 
定 的 对 象 四 一 次 “ping” 操 作 ， 则 认为 远程 引用 过 期 了 ， 引 用 计数 像 进程 正常 地 终止 -- 样 
被 减少 。 当 一 个 对 象 没 有 起 行 引 用 的 话 就 会 回收 该 对 象 所 用 的 资源 。 


6.5.4 DCOM 中 支持 的 线程 模型 


COM 和 DCOM 以 在 本 地 操作 系统 中 多 线程 的 方式 ( 见 第 2 章 ) 运行 。 由 于 DCOM 的 进 
程 间 通信 需要 DCE RPC, if] DCE RPC 要 求 能 在 任意 线程 中 处 理 RPC 消息 ， 因 此 对 DCOM 也 
就 有 同样 的 要 求 。COM 和 DCOM 的 编程 模型 随 当前 应 用 的 需要 扩展 ， 这 样 应 用 程序 开发 人 
员 需 要 提供 完全 的 自由 线程 调用 ， 此 外 DCOM 为 单线 程 提 供 了 方法 调用 的 自动 同步 。 

关于 线程 ，DCOM 使 用 了 套间 模型 。 从 参数 打包 方面 来 看 ， 可 以 将 每 个 线程 看 作 一 个 独 
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立 进 程 。 对 本 线程 的 访问 是 直接 访问 而 对 其 他 线程 的 访问 是 间接 访问 ， 间 接 访 问 可 能 是 通过 
代理 / 桩 程序 对 。 对 象 可 以 支持 以 下 三 种 线程 模型 ; 

1. 单线 程 套间 ， 只 有 主线 程 : 在 这 种 模型 中 ， 所 有 对 象 的 实例 由 与 该 对 象 相关 的 同一 
个 单线 程 创建 。 

2. 单线 程 套 问 : 每 个 实例 被 束缚 于 一 个 单线 程 ， 不 同 的 实例 可 以 由 不 同 的 线程 来 创建 。 

3. 多 线程 套间 : 实例 可 以 在 多 个 线程 中 创建 且 可 以 由 任意 线程 调用 。 

任何 作为 本 地 服务 器 来 运行 的 对 象 控制 着 它 的 对 象 的 套间 类 型 。 本 地 服务 器 通过 一 个 或 
多 个 线程 上 的 ComitializeEx 来 登记 该 类 或 多 个 类 工厂 ， 从 相应 线程 到 相应 线程 套间 模型 。 当 
创建 一 个 对 象 时 ，COM 需要 知道 该 对 象 是 否 与 其 父 对 象 的 线程 模型 兼容 。 如 果 不 兼 容 ， 那 
么 COM 就 尽力 将 该 对 象 加 载 到 与 之 兼容 的 另 一 个 套间 中 。 著 兼容 ， 则 相应 的 代理 / 桩 程序 就 
会 分 别 放 置 于 客户 方 和 该 对 象 间 以 使 它们 之 间 能 够 通信 。 由 于 DCOM 的 目标 是 让 应 用 程序 开 
发 人 员 具 有 全 面 的 灵活 性 ， 因 此 它 能 够 定制 线程 模型 。 


6.5.5 DCOM 的 安全 策略 


与 所 有 支持 分 布 式 计 算 的 系统 一 样 ，DCOM 也 必须 注重 其 内 部 的 安全 性 问题 。 基 于 这 点 
考虑 ， 设 计 DCOM 来 处 理 以 下 四 方面 的 安全 性: 

1. 访问 安全 性 : 保证 一 个 对 象 只 允许 由 具有 相应 权限 的 对 象 成 功 调用 。 

2. 激发 安全 性 : 保证 只 允许 合适 的 对 象 在 新 进程 中 创建 新 对 象 。 

3. 身份 : 对 象 依靠 什么 原则 来 鉴别 它 自己 。 

4. 连接 策略 : 包括 消息 何 时 可 以 被 修改 ， 以 及 消息 能 否 被 另 一 个 对 象 截取 ， 此 外 对 象 
身份 的 鉴别 也 是 属于 该 类 型 。 

访问 安全 性 可 以 在 对 象 级 、 方 法 级 、 参 数 级 或 在 更 高 的 进程 级 上 实现 。 访 问安 全 性 甚至 
可 以 被 设置 来 向 不 同 的 调用 者 提供 不 同 的 安全 检查 。DCOM 的 对 象 能 够 设置 它们 的 安全 策 
略 ， 并 允许 创建 新 对 象 而 无 需 显 式 的 安全 信息 。 

激发 安全 性 是 在 COM 库 中 实现 的 。 这 些 库 检 查 调用 者 所 请 求 操作 的 权限 ， 这 些 权 限 信 
息 设置 在 对 象 外 面 的 注册 表 中 。 

就 提供 安全 身份 而 育 ，DCOM 支持 多 种 安全 措施 ， 包 括 从 对 于 大 量 用 户 应 用 来 说 很 繁重 
的 对 象 级 安全 措施 到 虽然 方便 但 可 配置 性 稍 差 的 群 组 级 安全 措施 。 安 全 身份 可 能 会 由 于 每 个 
账号 不 只 限于 给 单个 用 户 而 进一步 复杂 化 ， 这 样 使 基于 用 户 的 安全 访问 变 得 更 加 困难 。 每 种 
方法 都 有 优点 和 缺点 ，DCOM 包含 多 种 方法 以 便 开发 人 员 灵 活 使 用 。 

对 于 连接 安全 性 ，DCOM 又 一 次 为 应 用 程序 提供 多 种 选择 ， 这 样 开 发 人 员 可 以 对 应 用 选 
择 最 合适 的 安全 级 别 。 源 地 和 目的 地 的 网 络 连接 数 越 多 ， 通 信 被 截取 的 可 能 性 就 越 大 。 安 全 
等 级 越 高 ， 就 需要 越 多 的 开销 来 执行 所 要 求 的 通信 。 实 际 安全 等 级 可 以 动态 地 选择 。 一 个 最 
好 的 预防 措施 是 利用 DCOM 支持 加 密 数 据 传 输 的 能 力 。 用 这 种 方法 就 可 以 确保 内 容 的 保密 性 
和 完整 性 。 

当 使 用 访问 检查 、 激 发 权限 检查 和 数据 保护 机 制 时 ， 需 要 某 种 方法 来 确定 客户 方 的 身 
份 。 有 几 种 安全 机 制 可 用 ， 这 些 安全 机 制 返回 惟一 的 会 话 权 标 作为 整个 连接 期 间 的 签 定 。 

由 于 常常 要 求 对 象 代表 它们 的 父 对 象 执行 操作 ， 安 全 措施 也 需要 结合 到 四 种 不 同 的 模仿 
级 别 中 来 。 第 一 等 级 是 匿名 〈SecurityaAnonymous)， 它 防止 得 到 调用 者 的 身份 。 第 二 等 级 
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是 身份 鉴别 (SecurityIdentification)，, 它 允许 对 象 检测 调用 者 的 安全 身份 ,但 对 象 不 
能 模仿 调用 者 。 第 三 等 级 是 模仿 (SecurityImpersonation)， 它 允许 对 象 模仿 并 执行 本 
地 操作 ， 但 对 象 不 能 代表 调用 者 调用 其 他 对 象 。 第 四 等 级 是 委托 (SecurityDelegation); 
对 象 可 以 模仿 调用 者 ， 而 且 对 象 可 以 使 用 调用 者 的 安全 身份 执行 方法 调用 。 在 Windows 2000 
操作 系统 中 ， 人 允许 DCOM 能 进行 全 面 的 系统 访问 并 可 以 利用 基本 的 Windows 2000 安全 框架 
(在 第 12 章 讨论 )。 应 当 注 意 到 全 面 的 系统 访问 订 能 会 使 一 个 参与 系统 的 可 信 上 度 和 安全 性 受 
到 破坏 。 


6.6 CORBA 概述 


公共 对 象 请 求 代 理 程序 体系 结构 CORBA 由 对 象 管 理 组 (Object Management Group，OMG) 
所 制定 。CORBA 目的 是 为 在 异 构 分 布 式 环境 中 的 应 用 提供 互 操作 性 。 它 有 时 也 称 为 中 间 件 ， 
因为 它 不 执行 对 于 操作 系统 所 要 求 的 最 低层 的 苏 能。 虽然 CORBA 必须 在 传统 操作 系统 之 上 ， 
但 是 它 能 执行 传统 操作 系统 领域 为 特定 的 分 布 式 环境 设计 的 许多 操作 。CORBA 最 初 由 数字 
设备 公司 、HP 公司 、HyperDesk 公司 、NCR 公司 、 对 象 设 计 公 司 及 SunSoft 公司 的 代表 组 成 
的 委员 会 所 定义 。 参 与 制定 CORBA 2.1 规范 的 公司 和 厂商 超过 750 家 ， 该 版 本 的 规范 在 1997 
年 八 月 被 采纳 。 它 在 [OMG97] 中 定义 。 在 本 节 中 ,我们 只 对 一 些 关键 的 概念 作 简短 的 概 
述 ， 因 为 完整 的 正式 规范 将 近 本 书 字数 的 两 倍 。 最 后 ， 需 要 指出 的 是 本 节 中 的 信息 和 图 解 是 
基于 CORBA 规范 2.1 [OMG97] 和 规范 2.2 [OMG98a] ， 这 些 使 用 得 到 了 OMG™M 的 许可 。 

如 前 所 述 ，CORBA 的 设计 是 全 面 的 但 又 不 失灵 活性 。CORBA 的 贡献 和 目标 是 简化 并 使 
含有 蜡 构 系 统 或 语言 的 异 构 环 境 下 的 计算 成 为 可 能 。CORBA 的 核心 是 对 象 请 求 代理 程序 
(ORB)， 这 将 在 6.6.1 节 中 讨论 。CORBA 其 他 的 主要 特性 是 对 象 适配器 的 定义 ， 见 6.6.2 
i, CORBA 的 消息 模型 将 在 6.6.3 节 中 讨论 。 在 6.6.4 节 讨 论 CORBA 标准 的 遵从 。 最 后 
CORBA 对 COM 的 映射 将 在 6.6.5 节 介 绍 。 


6.6.1 CORBA 的 ORB 


如 图 6-5 所 示 ORB 提供 了 透明 的 接口 ， 特 别 是 接口 独立 于 对 象 的 位 置 及 实现 语言 。 这 样 
ORB 允许 Smalltalk 的 对 象 与 C++ 的 对 象 通 信 并 一 起 工作 ， 即 使 它们 在 物理 上 位 于 地 球 两 端 。 
ORB 负责 处 理 其 中 所 有 的 转换 ， 通 过 与 对 象 适配器 相 接 的 通用 接口 定义 语言 (DL) 来 实现 。 
接口 由 具体 的 操作 及 参数 组 成 ， 有 三 种 类 型 的 接口 : 





= 《对 象 请 求 代理 程序 ) 


图 6-5 ORB 的 功能 
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1. 
2. 
3. 


6.6.2 


通用 型 : 通用 型 接口 用 于 对 所 有 ORB 实现 都 相同 的 操作 。 
对 象 类 型 : 这 种 接口 只 应 用 于 特定 类 型 对 象 所 特有 的 操作 。 
对 象 样式 ; 该 接口 只 用 于 对 特定 式样 的 对 象 实现 所 特有 的 操作 。 


CORBA 的 对 象 适配器 


CORBA 2.1 [OMG97] 规定 了 对 象 适配器 的 以 下 职责 : 

4 对 象 引用 生成 。 

4 对 象 引 用 解释 。 

4 方法 调用 。 

4 安全 交互 。 

4 对 象 及 实现 的 激活 和 撤消 。 

© 对 象 引 用 到 对 象 实现 的 映射 。 

4 所 有 对 象 实现 的 注册 。 

Xf RIG AC aS RE HS A BHAA ORB 内 核 。 它 们 负责 维护 自己 的 状态 。 当 处 理 调用 时 ， 它 
们 事实 上 是 在 跟 使 用 IDL 的 、 称 为 框架 的 组 件 进行 交互 。 一 个 对 象 实现 收 到 请 求 ， 以 及 框架 
如 何 安排 进 ORB 体系 结构 的 例子 如 图 6-6 所 示 。IDL 是 一 种 与 C++ 非常 类 似 的 高 层 对 象 语 
言 ， 对 象 适配器 的 每 个 实例 都 必须 在 所 有 的 ORB 实现 中 有 同样 的 接口 。 利 用 对 象 适配器 ， 
ORB 为 面向 对 象 和 非 面向 对 象 语言 提供 了 编程 语言 映射 。 这 样 C 和 Fortran 程序 可 以 利用 
CORBA ORB， 跟 C++ 和 Smalltalk 程序 协同 工作 。 





对 所 有 ORB 实现 都 相同 的 接口 


对 等 种 对 象 类 型 有 村 程序 和 框架 人 arian 
CI 与 ORB 相关 的 接 门 ues 
+ RAS OR | Ewin 


图 6-6 ”对象 实现 收 到 请 求 


虽然 基本 对 象 适 配器 (BOA) 满足 所 有 这 些 职责 ， 但 并 非 所 有 的 对 象 适配器 执行 每 一 个 
职责 。 例 如 设计 的 库 对 象 适配器 是 用 来 支持 带 有 库 实 现 的 对 象 。 由 于 假定 这 种 对 象 是 客户 机 
程序 ， 库 实现 不 支持 对 象 激活 和 身份 检查 。 又 如 数据 库 对 象 适配器 不 需要 提供 状态 信息 ， 因 
为 这 些 信 息 会 在 面向 对 象 数据 库 中 永久 存储 。 
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在 CORBA 2.2 之 前 ，BOA 是 惟一 定义 的 标准 对 象 适配器 。 结 果 ， 每 个 厂商 都 实现 各 自 
的 BOA， 在 这 个 过 程 中 显 云 出 了 规范 的 含糊 性 及 缺点 。 可 以 想象 这 导致 了 自 定 义 的 专 有 
BOA 实现 。 将 损害 ORB 之 间 的 互 操 作 。CORBA 2.2 可 通过 定义 可 移植 对 象 适 配器 (POA) 来 
缓解 这 个 问题 。 

服务 器 对 象 在 实现 一 个 使 用 POA 的 对 象 之 前 必须 先 获得 一 个 POA 对 象 。 根 POA 就 是 由 
ORB 管理 的 著名 POA 对 象 。 这 个 根 POA 提供 给 使 用 ORB 初始 化 接口 的 应 用 。 只 要 默认 的 策 
略 合适 ， 应 用 程序 开发 人 员 就 可 以 使 用 根 POA 来 创建 对 象 。 总 共有 七 种 与 根 POA 有 关 的 
策略 : 

1. 线程 策略 : 该 策略 文 持 包括 多 线程 〔 见 详细 说 明 6.3) 在 内 的 线程 选择 。 

2， 生 命 期 策略 : 除了 以 前 支持 的 持久 对 象 以 外 ， 又 有 支持 短暂 对 象 的 能 力 。 短 暂 对 象 
的 生命 周期 受 其 父 POA 生命 期 的 限制 ， 而 持久 对 象 的 生命 期 在 多 个 服务 器 中 间 持 续 。 这 种 
新 的 可 选 方案 对 于 清除 孤儿 对 象 ， 以 及 那些 父 对 象 已 经 终止 从 而 不 需 继 续 执行 的 子 对 象 特别 
有 用 。 

3， 对 象 ID 惟一 策略 : 该 策略 对 于 惟一 地 标识 每 个 对 象 很 必要 。 

4. DRAMAS: 对 象 的 田赋 值 可 以 从 应 用 程序 或 POA 中 获得 ， 这 将 产生 一 个 
system id 值 。 

5， 服 务工 具 保 留 策略 ; 如 果 POA 有 保留 策略 ， 它 就 从 请 求 中 得 到 对 象 DD 值 ， 调 用 相 
关联 的 对 象 。 如 果 POA 有 非 保留 策略 ， 则 POA 将 使 用 默认 的 服务 工具 或 服务 工具 管理 器 来 
定位 一 个 活动 的 服务 工具 。 服 务工 具 只 在 单个 请 求 期 间 内 才 是 活动 的 ， 没 有 与 服务 工具 -对 
象 关 联 的 记录 保留 下 来 。 

6. 请 求 处理 策 略 : 对 于 给 定 的 对 象 ID， 若 没有 服务 工具 与 它 关 联 或 定位 ， 则 POA 就 使 
用 USE_DEFAULT SERVANT USE_SERVANT_MANAGER 或 USE_OBJECT_MAP_ONLY 策略 来 
请 求 处 理 。 如 果 以 上 策略 都 不 存在 ， 则 将 引发 相应 的 异常 。 这 就 提供 了 将 对 象 请 求 调度 给 多 
个 对 象 实例 的 能 力 ， 必 然 会 增强 系统 均衡 分 布 负荷 的 能 力 。 

7， 隐 式 激活 策略 : 它 允 许 POA 用 指明 对 象 可 由 隐 式 激活 的 策略 来 创建 。 一 个 隐 式 策略 
需要 有 一 个 保留 策略 和 一 个 system_id。POA 提供 了 支持 隐 式 激活 的 操作 。POA 除了 有 执 
行 隐 式 对 象 注册 的 能 力 外 ， 还 能 执行 显 式 注册 。 这 允许 在 系统 内 部 发 出 请 求 之 前 ， 对 象 就 创 
建 可 以 通过 POA 来 接收 请 求 的 实例 。 





详细 说 明 6.3 
CORBA POA 线程 模型 = 











OA 时 ， 它 可 以 在 两 种 线程 模型 中 选择 其 中 的 
一 种 用 ORB 实现 。 如 果 沈 至 了 单线 程 模型 ， 则 单个 线程 处 竺 从 那个 POA 发 送 来 的 每 一 个 
对 象 请 求 ， 这 种 选择 的 结果 之 一 是 产生 顺序 理 。 同 样 地 ， POA 也 可 以 选择 由 ORB 控制 
的 模型， 在 这 种 情况 下 由 DRB 选择 线程 模型 ， . 国 此 若 低 层 的 运行 环境 支持 名 线程 则 可 以 
cl od lm BI OA nis ZAM OLAS hilek 
理 包 括 并 发 、 重 入 及 可 能 出 现 的 多 个 对 象 实例 在 内 的 多 线程 。 






SAMARA CORBA 框架 内 创建 一 个 ， 
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6.6.3 CORBA 的 消息 模型 


传统 的 CORBA 消息 提供 了 三 种 用 于 消息 调用 的 模型 : 第 一 种 模型 是 同步 模型 ， 客 户 方 
调用 操作 后 就 阻塞 起 来 直到 操作 执行 完毕 ; 第 二 种 模型 是 阻塞 模型 ， 客 户 方 调用 操作 后 继续 
执行 下 去 ， 之 后 通过 轮 询 来 获取 应 答 或 阻塞 起 来 等 待 应答 ， 它 只 用 于 动态 调用 ; 第 三 种 消息 
模型 是 非 确认 通信 ， 该 模型 保证 尽力 完成 通信 ， 但 发 送 方 不 等 待 或 检查 或 期 待 一 个 应 答 或 确 
认 ， 设 计 这 种 模型 是 为 了 使 CORBA 支持 UDP。 


6.6.4 遵从 CORBA 标准 


对 于 一 个 遵从 CORBA 标准 的 系统 ， 它 必须 符合 CORBA 内 核 的 规定 ， 以 及 至 少 提供 一 种 

147, 有 映射。 在 标准 中 指定 的 语言 是 C，C++ ，Smalltalk，COBOL，Ada 及 java。 对 于 每 种 语言 在 特 

定位 置 的 实现 ， 它 们 必须 按照 CORBA 规范 映射 到 该 语言 ， 称 为 遵循 CORBA。 换 言 之 ， 一 个 

系统 要 么 完全 遵循 CORBA， 要 么 不 遵循 CORBA。 如 果 一 个 厂家 支持 C++ ， 它 的 ORB 就 必须 
遵守 标准 中 规定 的 OMG IDL 到 C++ 的 绑 定 。 


6.6.5 CORBA 到 COM 的 映射 


CORBA 2.2 规范 在 第 16 节 给 出 了 数据 类 型 从 CORBA 到 COM 映射 的 信息 。 标 准 间 的 互 
操作 能 力 对 于 在 异 构 环境 中 成 功 构建 和 部 署 分 布 式 系统 是 很 重要 的 ， 因 为 有 可 能 需要 将 两 种 
标准 合并 。 这 不 是 一 件 容易 的 工作 ， 例 如 CORBA 和 COM 都 利用 接口 标识 符 来 惟一 地 标识 对 
象 接口 。 通 过 标识 符 ， 益 户 方 代 码 能 够 获取 包括 对 象 的 其 他 接口 信息 在 内 的 对 象 信息 。 若 
CORBA 和 COM 都 给 接口 指定 一 个 文本 的 名 字 ， 昌 然 便 于 记忆 但 都 不 能 保证 它 的 惟一 性 。 这 
PE CORBA 使 用 能 够 惟一 地 标识 接口 的 RepositoryId 来 标识 接口 M COM 使 用 被 称 为 ID 的 结 
构 来 标识 接口 。CORBA 和 COM 处 理 异常 的 方式 各 不 相同 。CORBA 利用 异常 来 报告 出 错 ， 并 
且 允 许 复杂 的 结构 通过 通信 交换 异常 信息 。 而 COM 仅 使 用 操作 的 返回 结果 HRESULT 的 类 型 
来 报告 错误 ， 该 结果 随后 转换 成 16 位 的 代码 。 不 幸 的 是 ， 不 可 能 将 CORBA 的 异常 完全 地 了 映 
射 到 这 些 代码 。 虽 然 CORBA 对 于 单 向 操作 指定 了 求 最 多 一 次 语义 ( 见 第 3 章 ), 但 是 COM 
却 不 保证 最 多 一 次 语义 。 这 些 只 是 这 两 种 标准 之 间 的 不 同 之 处 ， 以 及 互 操作 时 遇 到 的 困难 的 
几 个 例子 。 尽 管 存在 这 些 困难 ， 互 操作 仍然 是 可 能 的 ， 并 且 随 着 时 间 的 迁移 ， 它 将 会 变 为 一 
种 简单 的 任务 。 


6.7 小 结 


在 本 章 中 ,我 们 讨论 了 设计 操作 系统 的 对 象 方法 。 可 以 看 到 在 那些 选择 基于 对 象 的 操作 
ASP Bf, RE, ASAE RSE LES. 
并 非 所 有 的 对 象 方法 都 允许 继承 和 多 重 继承 。 当 允许 对 象 继承 时 必须 要 小 心 。 尽 管 对 象 
方法 存在 缺点 ， 但 该 方法 还 是 成 功 的 ， 并 且 关 于 这 个 主题 目前 仍 在 进一步 研究 。DCOM 和 
CORBA 也 在 快速 发 展 ， 因 为 它们 定义 了 用 于 分 布 式 计算 的 有 效 模型 。 除 了 基本 CORBA, th 
有 用 于 特定 领域 的 CORBA 体系 结构 ， 例 如 用 于 医疗 领域 的 CORBAMed 和 用 于 电信 业 的 COR- 
BAtelecoms .OMG98b]。 市 场 上 有 基于 CORBA 的 产品 ， 比 如 实现 了 ORB 思想 的 Chorus COOL, 
L148] DCOM 一 旦 从 Windows 开 台 诞生 后 ， 就 广泛 地 应 用 于 Windows 和 UNIX 平台 ， 它 也 是 分 布 式 领 
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域 的 主导 对 象 技术 。 

虽然 我 们 已 经 讨论 了 三 种 操作 系统 和 两 种 主 让 的 协议 ， 参 考 文献 部 分 还 有 其 他 基于 对 象 
的 操作 系统 和 相关 工作 的 信息 。Chorus COOL 和 Amoeba 都 支持 多 处 理 器 OHT) 的 分 布 式 系 
统 。Chorus 微 内 核 也 支持 实时 应 用 ， 虽 然 这 种 支持 与 它 的 基于 对 象 设计 无 关 而 是 在 它 的 调度 
算法 中 使 用 了 优先 级 。 随 着 这 些 系 统 的 成 功 和 面向 对 象 的 发 展 趋势 ， 将 会 有 越 来 越 多 的 面向 
对 象 操作 系统 不 仅 是 作为 研究 项 目 而 且 也 会 作为 商业 化 的 产品 被 开发 出 来 。 


6.8 参考 文献 


关于 基于 对 象 的 实时 操作 系统 的 概述 见 [AKZ96]。 某 些 与 本 章 内 容 有 关 的 研究 论文 包 
括 [ARJ97, BSCEFHLS93, CIRM93, DLAR91, GhSc93, HaSe98, Hen98, Her94, Kim97, Lin95, 
LJP93, LoKi97, Micr98, MVTVV90, OMG97, OMG98a, OMG98b, OSH95, Sch98, Sie98 以 及 
Vin98 ]。 

以 下 提供 了 在 Intemet 上 的 一 些 关于 基于 对 象 操 作 系统 的 链接 。CORBA ERE http: // 
www. omg, org/omg00/wicorba. htm。 关 于 CORBA 的 最 新 的 规范 、 和 白皮书 和 参考 书籍 的 列表 见 ht- 
tp: //www.omg.org/store/pub. himo Amoeba 的 主页 在 http: //www.am.cs.vu.nl。Choms 的 主页 在 
http: //www.Chorus.com/, Choices 是 另 一 种 面向 对 象 的 分 布 式 操作 系统 ， 带 有 出 版 物 的 主页 
在 http: //choices.cs.uiuc.edu/choices/index.html。 关 于 SUN 公司 的 面向 对 象 操作 系统 Spring 的 
文章 见 Spring 的 论文 主页 在 http: //www.sun.com/tech/projects/spring/ papers. html。 对 DCOM 在 
所 有 主要 的 UNIX 平台 有 商业 化 的 实现 Software AG 公司 的 主页 在 http: //www.sagus.com。 


习题 


6.1 允许 多 重 方法 的 构造 器 的 优点 是 什么 ” 它 会 引起 哪些 困难 ? 

6.2 与 简单 继承 相 比 ， 多 重 继承 的 优 缺 点 各 是 什么 ? 

6.3. 试 阐述 在 分 布 式 环境 中 使 用 基于 对 象 的 模型 的 优 缺点 。 

6.4 在 第 2 章 中 ， 我 们 讨论 了 各 种 与 迁移 有 关 的 问题 。 请 问 使 用 对 象 作为 迁移 单位 的 
优 缺 点 各 是 什么 ? 

6.5 CORBA 是 有 助 于 迁移 还 是 妨碍 迁移 ? 请 说 明 原 因 。 

6.6 请 阐述 在 分 布 式 环境 中 使 用 CORBA 的 优点 。 

6.7 WHA Clouds 只 允许 通过 对 象 的 人 口 点 来 访问 对 象 ? 

6.8 为 什么 Clouds 中 的 数据 共享 只 能 通过 对 对 象 的 调用 来 实现 ? 

6.9 Cloud 的 段 可 有 多 个 页 大 小 的 优点 是 什么 ? 

6.10 为 什么 对 于 COOL 来 说 允许 上 下 文 空间 重新 映射 很 有 必要 ? 

6.11 本 章 讨 论 的 所 有 操作 系统 都 支持 持久 性 。 为 什么 在 分 布 式 系统 中 持久 性 是 一 个 非 
常 重要 的 特性 ? 

6.12 请 阐明 由 COOL 的 通用 运行 时 系统 层 支 持 的 代理 服务 的 优点 。 

6.13 在 Amoeba 中 ， 为 什么 端口 的 知识 不 能 够 充分 保护 Amoeba ARS? 试 说 明 一 种 可 以 
不 需要 客户 方 的 权能 的 情形 。 

6.14 Clouds 和 Amoeba 都 提供 全 局 惟一 名 字 。 全 局 惟一 名 字 的 优点 是 什么 ”如 果 不 使 
用 全 局 惟一 名 字 则 可 能 会 出 现 什 么 问题 ? 
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第 7 章 分 布 式 进程 管理 


在 本 章 中 ,我 们 将 讨论 分 布 式 环境 中 有 关 进 程 管理 的 各 种 问题 ， 包 括 对 第 2 章 中 介绍 过 
的 一 般 进 程 管理 的 扩展 。 具 体 地 说 ， 在 7.1 节 中 介绍 分 布 式 调度 算法 的 选择 。7.2 节 讨 论 各 
种 调度 算法 ， 对 每 种 算法 都 举 出 了 一 个 例子 .在 7.3 节 讨 论 与 协调 者 选举 有 关 的 问题 ， 协 调 
者 是 一 个 在 使 用 集中 式 服务 器 的 分 布 式 系统 中 的 进程 ， 对 各 种 问题 的 所 有 解决 方案 来 说 都 是 
必要 的 。7.4 节 介 绍 与 管理 进程 有 关 的 问题 ， 重 点 讨论 分 布 式 系统 中 父 进 程 由 于 系统 崩溃 而 
151 | 终止 时 子 进程 的 有 关 问 题 。 


7.1 分 布 式 调度 算法 选择 


Casavant 和 Kuhl [CaKu88] 为 各 种 类 型 的 调度 算法 的 分 类 提出 了 一 种 分 类 法 。 我 们 将 讨 
论 7.1.1 至 7.1,4 节 中 各 种 调度 算法 的 选择 ， 每 种 选择 都 能 用 来 对 调度 算法 分 类 。 图 7-1 中 
介绍 的 调度 决策 图 反映 了 调度 算法 的 各 种 选择 ， 详 细 说 明 7,2 将 概述 全 局 调度 器 的 算法 选择 。 










[负荷 平衡 或 负荷 分 担 ] 


最 优 的 ARA 次 优 类 型 [近似 或 月 发 式 ] 
i 
FR mae | APREA | 
| Wai 
图 7-1 调度 决策 图 


7.1.1 调度 层次 
分 布 式 系统 必须 对 调度 的 层次 作出 选择 ， 这 种 选择 在 集中 式 系统 中 无 效 。 在 分 布 式 系统 
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中 ， 对 进程 的 调度 有 两 级 层次 : 本 地 调度 和 全 局 调度 。 本 地 调度 涉及 到 将 一 个 进程 分 配 到 一 
个 具体 的 处 理 器 上 ， 而 全 局 调度 则 处 理 选择 在 什么 地 点 上 的 哪个 处 理 器 来 执行 已 知 的 进程 。 
全 局 调度 在 有 的 文献 中 也 称 为 处 理 器 分 配 ， 全 局 决策 必须 在 本 地 决策 之 前 作出 。 在 分 布 式 环 
境 中 ， 两 种 选择 都 必须 在 某 -一 时 间 内 作出 ， 但 没有 必要 在 同一 时 间 内 作出 。 在 本 章 中 ， 我们 
只 讨论 全 局 调度 ， 与 本 地 调度 有 关 的 问题 请 参阅 第 2 章 。 

7.1.2 负荷 分 布 目 标 


如 第 2 章 所 述 ， 有 两 种 负荷 分 配 目标 。 一 个 目标 是 负荷 平衡 ， 它 是 在 整个 分 布 式 系统 中 
各 人 处理 器 间 努 力 维持 相等 的 负荷 。 负 区 平衡 需要 相当 大 的 开销 和 不 断 的 系统 性 能 评估 。 第 二 
个 目标 更 常见 ， 是 简单 的 负荷 分 担 。 负 荷 分 担 努 力 防止 任何 节点 过 载 。 与 负荷 平衡 相 比 负荷 
分 担 是 一 个 更 容易 达到 的 目标 。 图 7-2 描述 了 如 第 2 章 所 述 的 负荷 分 配 的 三 种 状态 ; 


A AG 
| 2 3 4 


B. 可 接受 的 负 蓟 分担 


Sey] a 
z ek HA rare 
2 3 4 


P 
1 


C 不 可 接 胶 的 负荷 分 担 


ey) a) Le 
+a HA HK A 


图 7-2 负荷 分 布 目标 
7.1.3 调度 的 有 效 目标 


调度 算法 可 以 提供 两 级 调度 目标 : 最 优 调度 方案 和 次 优 调度 方案 。 对 于 最 优 调度 算法 ， 
调度 者 必须 掌握 所 有 竞争 进程 的 状态 及 相关 的 信息 。 最 优化 可 以 用 完成 时 间 、 资 源 利 用 率 、 
系统 吞吐 量 或 它们 之 间 的 任何 组 合 来 衡量 。 最 优 方案 计算 在 超过 两 个 处 理 器 的 情况 下 由 于 
NP 困难 的 问题 而 不 可 行 ， 所 以 常常 使 用 次 优 方案 。 次 优 方案 分 为 两 类 ， 近似 的 方案 和 使 
用 启发 式 方法 的 方案 。 详 细 说 明 7.1 介绍 了 用 来 确定 最 优 调度 算法 的 基准 : 


od ee eee eee ere 
调 | 效 基准 ie 8) > - ee : ; 


。 有 许多 基准 用 来 确定 区 筑 量 调 度 的 育 懂 性 ， 调 度 算 演 可 以 使 用 以 下 一 个 改 多 个 基准 。| 

































”NP 困难 问题 是 不 可 计算 的 ， 它 没有 已 知 的 多 项 式 时 间 算 法 存在 。 
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。 一 个 最 常见 的 基准 是 通信 开销 。 使 用 这 各 基准 的 调度 算法 考虑 用 于 向 某 给 定 节点 迁 





用 情况 或 任何 反映 给 定 节点 的 资源 状况 为 基准 。 
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移 进 程 的 时 间 开 销 。 更 重要 的 是 它 也 必须 考虑 分 配 到 特定 进程 位 置 的 进程 间 的 通信 开销 。 
当 进 程 不 需要 同 其 他 进程 进行 通信 时 ， 这 种 开销 很 小 。 车 执行 计算 的 过 程 中 该 进程 与 需 
要 通信 的 其 他 进程 位 于 同一 个 节点 的 话 ， 开 销 也 会 很 小 。 

执行 开销 是 另 一 种 流行 的 基准 ， 该 基准 反映 了 将 进程 指派 到 给 定 节 点 的 基于 环境 的 
开销 。 如 果 该 环境 与 进程 原来 的 环境 一 样 ， 则 执行 开销 为 零 。 但 如 果 给 定 节点 运行 不 同 
的 操作 系统 或 使 用 不 同 字符 囊 编码 模式 、 不 同 的 0 表示 方法 和 是 数 表示 方法 等 不 同体 系 ， 
别 由 于 需要 的 转换 量 很 大 司 得 执行 开销 将 会 非常 之 大 。 

资源 利用 基准 是 根据 分 布 式 系统 中 各 节点 当前 的 负荷 来 确定 将 进程 调度 到 一 个 恰当 
的 位 置 。 资 源 利用 基准 可 以 是 基于 节点 的 负 珍 状态 ， 一 个 更 加 精确 的 基准 可 以 包括 负荷 
索引 以 提供 比 两 级 或 三 级 状态 更 广 的 范围 。 资 源 利用 基准 也 可 以 资源 队列 长 度 、 内 存 合 








次 优 的 近似 方案 

次 优 的 近似 方案 常常 利用 同 最 优 方案 一 样 的 算法 ， 但 不 进行 求 出 最 优 调度 方案 所 需 的 所 
有 步骤 ， 而 是 通过 限制 搜索 空间 来 尽 可 能 快 地 找到 一 个 非常 好 的 调度 方案 。 为 了 确定 一 个 可 
接受 的 次 优 调度 方案 ， 人 必须 对 依据 某 种 基准 次 优 方案 将 产生 怎样 的 结果 有 一 些 概念 了 解 。 此 
外 次 优 方案 必须 适合 于 智能 的 快捷 方法 ， 这 些 快 捷 方 法 可 能 会 使 用 启发 式 方法 或 先 模仿 最 优 
方案 而 后 使 用 启发 式 方 法 的 近似 方案 。 

次 优 的 启发 式 方案 

次 优 的 启发 式 算法 使 用 经 验 法 则 或 直 党 来 进行 调度 。 这 些 启 发 式 方法 也 许 不 能 被 证 明 ， 
并 可 能 在 某 种 环境 下 会 偏离 其 出 发 点 或 完全 错误 ， 但 一 般 认 为 它们 能 以 可 接受 的 方式 发 挥 作 
用 。 以 下 是 一 些 可 能 的 启发 式 调度 方法 : 

1. 需要 大 量 进程 间 通 信 的 相关 进程 应 当 位 于 邻近 的 位 置 ， 一 般 是 位 于 同一 节点 。 

2. 更 改 共享 文件 的 多 个 独立 进程 应 当 位 于 邻近 的 位 置 ， 一 般 是 位 于 同一 节点 。 

3. 带 有 少量 优先 关系 或 无 优先 关系 的 可 分 割 进程 很 容易 分 布 ， 就 将 它们 进行 分 布 。 

4. 如 果 某 个 系统 的 负荷 已 经 很 重 ， 不 要 再 调度 其 他 进程 到 该 节点 。 

以 上 规则 如 同 所 有 的 启发 式 方法 一 样 ， 可 能 不 会 直接 地 或 定量 地 影响 系统 性 能 ， 但 这 些 
基于 直觉 的 规则 能 够 帮助 提高 系统 的 性 能 。 近 似 算法 可 以 利用 启发 式 方法 来 得 到 快捷 方法 ， 
而 启发 式 次 优 调度 者 在 整个 的 调度 算法 中 使 用 启发 式 方法 。 


7.1.4 ABRA ENK 


该 项 确定 什么 时 候 调 度 算法 ， 以 及 决定 进程 将 在 何 时 何 地 执行 ， 这 种 决定 涉及 到 将 进程 
绑 定 到 某 个 特定 的 处 理 器 组 ， 即 带 有 一 个 或 多 个 紧 耦 合 处 理 器 的 内 存单 元 。 调 度 算 法 可 以 提 
供 静 态 绑 定 或 动态 绑 定 。 在 静态 调度 算法 中 ， 每 个 进程 的 可 执行 映像 在 链接 时 已 静态 地 指派 
给 特定 的 处 理 器 组 。 与 静态 绑 定 算法 相反 ， 当 可 执行 映像 创建 时 动态 调度 算法 不 决定 进程 在 
何 时 / 何 地 运行 ， 而 是 可 执行 映像 以 可 以 重 定位 的 方式 来 创建 ， 这 样 允许 在 以 后 某 个 合适 时 
间 里 绑 定 到 特定 处 理 器 (和 位 置 ) 上 。 动 态 调度 算法 也 必须 确定 调度 者 的 责任 和 决定 的 永久 性 。 
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调度 者 责任 

调度 者 责任 可 以 由 集中 式 或 分 布 式 的 方式 决定 。 该 调度 者 决策 可 以 应 用 到 分 布 式 系 统 和 
并 行 系统 中 ， 在 分 布 式 系统 中 更 为 常见 。 此 外 ， 调 度 者 责任 只 应 用 于 使 用 动态 绑 定 的 调度 者 
中 ， 它 确定 调度 责任 是 否 由 在 单 处 理 器 上 的 集中 式 服务 器 来 履行， 或 者 调度 算法 是 否 物 理 分 
布 在 多 个 处 理 器 〈 可 能 在 不 同 的 位 置 上 ) 中 。 如 果 调 度 算法 是 集中 式 的 ， 则 作出 所 有 调度 决 
年 的 处 理 器 成 为 系统 中 的 关键 部 件 。 若 调度 处 理 器 失效 时 没有 备用 处 理 器 来 接管 它 的 工作 ， 
则 当 该 集中 式 服务 器 裔 省 或 不 可 用 时 整个 系统 就 会 停止。 

分 布 式 的 、 动 态 的 全 怀 调 度 算法 也 必须 对 参与 选择 者 作出 决策 。 参 与 选择 者 包括 自愿 或 
强制 选择 参与 者 。 在 自愿 调度 算法 中 ， 每 个 本 地 的 调度 者 对 它 的 资源 及 它们 的 利用 有 更 大 程 
度 的 自治 人 性。 处 理 器 不 会 也 不 能 被 追 参与 或 协作 。 相 反 ， 强 制 调度 算法 强迫 每 个 处 理 器 有 它 
的 分 量 ， 每 个 处 理 器 被 迫 拟 行 它 的 调度 任务 以 满足 系统 范围 的 性 能 目标 。 不 管 调度 者 责任 和 
参与 状况 如 何 ， 调 度 算法 可 以 选择 使 用 最 优 的 、 次 优 启发 式 的 或 次 优 近 似 的 方案 。 

调度 者 决策 的 永久 性 

动态 调度 算法 可 以 使 用 永久 性 分 配 ( 即 所 有 的 分 配 都 是 一 次 性 的 分 配 ) 或 允许 动态 的 重 
新 分 配 。 一 且 调 度 决定 作出 后 一 次 性 分 配 是 不 可 改变 的 ， 而 动态 重新 分 配 允 许 在 进程 开始 执 
行 后 迁移 进程 和 重新 分 配 。 一 次 性 分 配 调 度 者 在 进行 分 配 时 经 常 依赖 用 户 信息 ， 而 使 用 动态 
重新 分 配 的 适应 性 调度 者 利用 进程 在 执行 时 创建 的 信息 来 改变 原先 的 调度 决策 和 迁移 进程 。 
这 样 动态 重新 分 配 允 许 调度 者 不 断 地 适应 。 当 然 ， 经常 的 改变 由 于 迁移 开销 ( 见 第 2 和 第 4 
章 ) 会 降低 系统 性 能 。 虽 然 某 些 系统 只 使 用 其 中 一 种 方法 或 其 他 方法 ， 但 是 大 多 数 调度 算法 
不 是 固定 为 一 次 性 或 适应 性 ， 而 是 可 以 使 用 任何 一 种 方法 。 
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“8 逆 优 静态 调度 者 。 
RR KER PRG SORE 
最 优 适应 性 集中 式 动 态 调度 者 。 | 
O $ 自 怀 最 优 一 痰 性 分 市 式 动态 调度 者 。 
人 强制 最 优 一 次 性 分 布 式 动态 调度 者 。 
全 自愿 最 优 适 应 ， 性 分 布 式 动态 调度 者 2 
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4 次 优 近似 一 次 性 集中 式 动态 调度 者 。 
“次 优 启发 式 一 次 性 集中 式 动态 调度 者 。 
_ 二 次 估 近似 适应 性 集中 式 动态 调度 者 。 
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自愿 次 优 近 和 似 一 次 性 分 布 式 动态 调度 者 。 

” # 强制 次 优 近似 一 次 性 分 布 式 动态 调度 者 。 

- § BRARARA-RESHA DOMES. 
+ 强制 次 优 启发 式 -- 次 性 分 布 式 动态 调度 者 。 
”下 自古 次 优 近 似 霹 应 性 分 布 式 动态 调度 者 。 
。 9 强制 次 优 近似 适应 性 分 布 式 动态 调度 者 。 
。 二 自愿 次 优 启发 式 过 应 性 分 布 式 动态 调度 者 。 











。 个 强制 次 化 启发 式 过 应 性 分 布 式 动态 调用 者 。 








7.2 调度 算法 的 方法 


在 上 一 节 中 ， 我 们 讨论 了 关于 调度 算法 的 各 种 选择 ， 并 枚 举 了 基于 这 些 选择 的 各 种 调度 
算法 类 型 。 本 节 我 们 将 介绍 调度 算法 的 各 种 方法 ， 每 种 方法 都 是 先进 行 介绍 ， 随 后 再 详细 地 
讨论 使 用 该 方法 的 一 个 调度 者 例子 。 以 下 是 一 些 调度 者 类 型 的 示例 和 它们 所 对 应 的 章节 : 

$7.2.1 节 ; 负荷 分 担 、 次 优 、 启 发 式 、 一 次 性 的 、 集 中 式 的 动态 调度 算法 。 

4 7.2.2 节 : 负荷 平衡 、 次 优 、 近 似 、 集 中 式 的 动态 调度 算法 。 

4 7.2.3 节 : 负荷 分 担 、 全 局 、 次 优 、 启 发 式 的 静态 调度 算法 。 

4 7.2.4 节 : 负荷 分 担 、 强 制 、 次 优 、 启 发 式 、 适 应 性 、 分 布 式 的 动态 调度 算法 。 


7.2.1 使 用 点 数 方法 


每 个 系统 的 使 用 点 数 的 方法 可 以 
维护 和 利用 起 来 以 保证 对 分 布 式 系统 
的 公平 使 用 。 这 种 方法 一 般 涉 及 到 一 
个 集中 式 服务 器 ， 最 好 是 用 在 小 型 的 
分 布 式 系统 中 。 该 集中 式 服务 器 维护 
着 一 个 使 用 表 ， 该 表 对 每 台 加 入 到 系 
统 中 的 计算 机 含有 一 个 人 口 。 如 果 某 
台 计 算 机 请 求 并 利用 不 在 本 地 的 资 
源 ， 例 如 利用 一 个 远程 处 理 器 来 调度 


ALES 
支付 使 用 点 














一 个 进程 ， 则 它 就 支取 使 用 点 。 如 果 a 
一 个 参与 者 允许 另 一 个 参与 者 使 用 本 BOR AE M 


L 请 远程 调度 这 个 进程 
地 资源 ， 那 么 就 会 减少 该 节点 的 使 用 2 这 是 将 执行 的 进程 


点 ， 如 图 7-3 所 示 。 一 个 慷慨 的 节点 图 7-3 使 用 点 数 方法 
与 大 量 地 使 用 外 部 资源 的 节点 相 比 ， 
使 用 点 的 点 数 要 少 一 些 。 给 定 节点 的 总 的 使 用 点 数 用 来 确定 调度 ， 使 用 点 数 较 低 的 节点 总 是 
在 使 用 点 数 较 高 的 节点 之 前 被 调度 来 提供 非 本 地 服务 。 

使 用 点 比较 简单 ， 因 为 无 论 是 使 用 外 部 资源 支付 一 个 使 用 点 ， 还 是 允许 外 部 进程 在 本 地 
执行 时 收取 一 个 使 用 点 ， 每 个 动作 都 认为 是 一 个 使 用 点 。 此 外 还 可 以 实现 一 种 更 加 复杂 的 受 
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经 济 学 影响 的 模式 ， 这 种 方法 也 称 为 经 济 使 用 点 。 在 这 个 使 用 点 方法 的 变种 中 ， 利 用 外 地 资 
源 的 支付 是 基于 该 系统 的 负荷 。 JEREJ 

在 负荷 很 重 的 系统 中 利用 外 地 资 支付 使 用 点 

源 比 在 负荷 较 轻 的 系统 中 利用 外 
地 资源 支付 得 更 多 。 当 本 地 系统 
负荷 很 重 时 允许 一 个 外 部 进程 在 
本 地 执行 会 得 到 更 大 的 上 点数 。 在 
任何 一 种 情况 下 ， 向 一 节点 收取 
的 点 数 等 于 被 使 用 的 系统 得 到 的 
点 数 。 每 个 节点 维护 着 一 个 如 图 
74 所 示 的 当前 报价 表 。 建 立 基 

















于 经 济 学 的 使 用 点 可 以 严格 地 确 
定 被 利用 资源 的 负荷 索引 ， 或 者 1 请 远程 调度 这 个 进程 Fal 
可 以 基于 投标 模式 。 当 将 投标 模 2 这 是 将 执行 的 进程 

式 结合 到 该 算法 中 时 ， 支 位 的 点 图 74 经 济 使 用 点 

数 (仍然 等 于 收取 的 点 数 ) 是 可 


协商 的 ， 这 样 系统 可 以 到 处 寻找 最 佳 的 交易 。 投 标 模式 的 思想 最 初 是 由 Ferguson, Yemini 和 
Nikolaou 引入 的 [FYN88]。 

一 个 基于 简单 使 用 点 的 调度 算法 的 例子 如 论文 [MuLi87] 所 述 ， 他 们 的 算法 提出 了 一 个 
次 优 、 启 发 式 、 一 次 性 、 集 中 式 的 动态 调度 算法 ， 称 为 上 -下 算法 。 除 了 允许 其 他 参与 者 在 
使 用 本 地 资源 时 减少 使 用 点 外 ， 参 与 者 也 会 因为 未 满足 的 资源 使 用 要 求 而 临时 地 减少 点 数 。 
如 果 当 收 到 请 求 时 集中 式 调度 服务 器 任何 参与 者 没有 拥有 可 用 的 资源 ， 进 程 调度 请 求 不 能 满 
足 。 如 果 系 统 没 有 未 解决 的 请 求 且 资 源 是 可 用 的 ， 则 所 有 节点 使 用 点 也 会 减少 。 这 种 减少 可 
以 是 每 次 出 现时 的 一 次 性 事件 ,或 存在 这 种 状态 时 允许 按 预 定时 间 帧 的 多 次 调整 。 例 如 ， 所 
有 系统 在 每 次 存在 这 种 状态 时 减少 一 点 或 处 在 这 种 状态 的 每 分 钟 就 减少 一 点 。 上 -下 算法 允 
许 使 用 点 数 小 于 零 ， 这 样 就 可 允许 当 一 个 慷慨 节点 需要 大 量 帮 助 来 执行 进程 时 ， 积 累 信 用 以 
用 于 将 来 某 个 时 间 。 


7.2.2 图 论 方法 


这 种 方法 的 核心 在 于 图 论 ， 具 体 地 说 在 于 获取 图 中 项 点 的 最 小 割 集 或 计算 图 的 最 大 流 
量 。 我 们 首先 介绍 称 为 最 小 分 割 (mincu) 的 顶点 的 最 小 割 集 问 题 ， 这 种 方法 利用 了 一 个 指 
派 图 (assignment graph)。 在 指派 图 中 进程 和 它们 的 可 能 指派 表示 在 一 个 无 向 图 中 。 该 图 的 顶 
点 如 果 记 为 p 则 代表 一 个 进程 ， 若 记 为 1 则 代表 一 个 节点 ， 该 图 中 没有 标示 优先 关系 。 如 果 
两 个 p 顶点 之 间 有 一 条 边 ， 则 说 明 被 表示 的 两 进程 互相 通信 ， 应 当 被 指派 到 同一 节点 。 如 果 
一 个 pp 顶点 被 一 条 边 连 到 一 个 1 顶点 上 ， 则 说 明 该 进程 可 能 被 指派 到 1 节点。 指派 图 的 边 包 
含有 代表 特定 调度 算法 目标 的 某 种 形式 的 权 值 。 为 了 将 进程 指派 到 特定 节点 ， 每 个 节点 顶点 
都 必须 从 图 中 分 割 出 去 ,图 的 分 割 通过 断 开 图 的 边 的 方法 进行 。 为 了 将 一 个 顶点 从 图 中 分 割 
出 去 ， 必 须 切断 开 一 组 边 ， 以 使 被 分 割 的 顶点 从 图 的 其 他 部 分 中 分 离 出 来 。 这 样 当 一 个 顶点 
分 割 出 去 后 ， 包 含 此 顶点 的 子 图 就 不 再 有 任何 边 连接 到 原 图 其 余部 分 了 。 例 如 图 7-5 描述 了 
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图 7-5 两 个 处 理 器 的 最 小 分 割 示例 


一 个 有 两 个 处 理 髓 的 最 小 分 割 。 为 了 移 走 顶 点 而 被 切断 的 边 的 集合 称 为 分 割 集 。 每 个 分 割 集 
包含 有 一 个 代表 节点 的 ] 顶点 。 当 一 个 p 顶点 由 一 条 边 连 到 一 个 1 顶点 上 时 ，p 顶点 代表 的 
进程 就 指派 给 1 节点。 分 割 集 的 开销 就 是 为 移 走 顶点 而 被 切断 的 边 的 权 值 的 总 和 。 最 小 分 割 
集 表示 分 割 特定 项 点 的 最 小 可 能 开销 。 任 何在 分 割 节点 的 最 小 分 割 图 中 的 任务 会 被 考虑 指派 
给 该 分 割 节点 。 处 理 器 指派 的 总 共 开 销 是 分 割 每 个 节点 顶点 的 开销 总 和 ， 因 此 最 小 分 割 的 目 
标 就 是 使 指派 开销 的 总 和 最 小 。 对 于 给 定 的 指派 图 分 审 所 有 节点 顶点 的 最 小 开销 一 一 最 小 分 
割 代表 了 最 优 的 调度 方案 。 

我 们 现在 讨论 基于 计算 图 的 最 大 流量 的 第 二 个 图 论 方法 。 该 方法 利用 了 最 大 流量 指派 
H. 该 图 的 顶点 如 果 记 为 p 则 代表 一 个 进程 ， 若 记 为 | 则 代表 一 个 节点 。 在 这 种 情况 下 ， 图 
的 边 是 有 向 的 〈 由 箭头 来 表示 )， 它 代表 进程 对 和 芒 头 指向 的 节点 顶点 的 可 能 的 指派 。 每 条 边 
包含 有 代表 该 边 流量 的 权 值 ， 在 本 应 用 中 边 的 权 值 越 大 说 明 在 给 定 进程 和 节点 间 的 流量 越 
大 。 最 大 流量 指派 图 的 目标 是 将 进程 指派 给 使 得 整 张 图 的 流量 之 和 最 大 的 节点 ， 这 通过 选择 
带 有 最 大 权 值 的 边 来 获得 。 在 图 论 领域 ， 获 取 最 小 分 割 集 的 目标 和 获取 最 大 流量 的 目标 是 等 
价 的 ， 有 很 多 算法 是 用 这 两 种 方法 来 评估 一 个 图 。 选 择 使 用 哪 种 图 论 方法 来 解决 调度 问题 就 
由 应 用 者 自己 来 决定 。 

我 们 现在 介绍 一 个 共 于 图 的 最 小 分 割 调 度 算 法 的 例子 ， 这 个 例子 所 讲 的 是 负荷 平衡 、 全 
局 、 次 优 、 近 似 、 集 中式 的 动态 调度 算法 ( 见 Lo [88])。 该 算法 可 用 于 一 次 性 的 指派 或 用 
于 适应 性 的 指派 ， 以 下 是 性 能 评估 的 基础 ， 

4 由 进程 指派 所 引起 的 总 共 的 执行 和 通信 开销 最 小 化 。 

4 总 共 的 干扰 开销 最 小 化 ， 使 并 发 度 增加 。 

两 个 进程 之 间 的 干扰 开销 反映 了 它们 的 不 兼容 性 ， 用 来 将 高 干扰 开销 的 进程 调度 到 不 同 
的 节点 上 。 一 个 高 干扰 开销 的 例子 是 两 个 进程 都 需要 大 量 CPU 集中 的 操作 ， 而 一 个 高 输入 / 
输出 进程 和 一 个 需要 大 量 CPU 集中 操作 的 进程 就 只 有 相对 较 小 的 干扰 开销 。 这 种 算法 假定 
编译 器 或 系统 为 所 有 进程 提供 了 执行 和 通信 开销 ,实际 上 这 些 值 可 以 是 近似 值 ， 因 为 开销 的 
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计算 将 极 有 可 能 对 系统 性 能 产生 影响 。 这 种 调度 算法 不 考虑 与 内 存 需 求 、 最 后 期 限 及 优先 关 [161] 
系 等 相关 的 问题 ， 因 此 它 是 一 个 近似 算法 ， 因 为 在 算法 后 面 的 步骤 中 利用 了 直觉 。 忽 略 某 些 
信息 是 允许 的 ， 忽 略 一 些 变量 和 假定 它们 是 常量 来 研究 和 评价 一 个 特定 方法 也 是 很 常见 的 。 

对 于 该 调度 算法 ， 目 标 是 整个 分 布 式 系统 中 所 有 与 指派 有 关 的 执行 和 通信 开销 最 小 化 。 
利用 指派 图 ，Lo 的 次 优 启发 式 算法 由 以 下 三 个 阶段 组 成 ， 

1. 44 (Crab): 对 于 每 个 节点 ,节点 抢夺 由 大 的 权 值 表示 的 对 它 很 有 吸引 力 的 所 有 的 
进程 。 由 于 这 种 权 值 很 大 ， 它 代表 了 我 们 不 太 希 望 分 割 的 边 。 如 果 本 阶段 结束 时 产生 了 每 个 
节点 的 完全 的 分 割 ， 则 说 明 我 们 已 经 得 到 了 一 个 最 优 的 调度 方案 ， 否 则 继续 进行 下 一 阶段 。 

2. 聚集 (Lump); 聚集 是 将 所 有 未 指派 的 任务 尽力 地 指派 给 一 个 节点 ， 即 将 它们 聚集 
起 来 。 这 种 可 能 的 指派 开销 将 进行 计算 并 跟 相应 的 通信 开销 比较 ， 这 些 通信 开销 只 有 在 进程 
没有 聚集 到 一 起 时 才 会 产生 。 如 果 通 信 开 销 比 聚集 开销 高 则 算法 就 进行 相应 的 聚集 ， 否 则 聚 
集 就 不 是 最 小 的 开销 和 最 有 效 的 指派 ， 这 样 算法 就 进行 第 3 阶段 。 

3. HE (Greedy): 贪 梦 算法 的 中 心 是 确定 进程 间 通 信 开 销 很 高 的 进程 组 。 这 些 进 程 需 
要 调度 到 同一 节点 ， 而 不 同 进程 组 可 以 指派 到 六 同 的 节点 。 本 阶段 考虑 与 分 割 有 关 的 开销 ， 
即 通信 开销 和 执行 开销 。 由 于 并 非 每 种 可 能 性 都 被 检验 ， 所 以 该 阶段 的 结果 是 次 优 的 。 

在 [L088] 中， 也 有 在 第 3 阶段 即 贪 禁 阶 段 使 用 更 复杂 标准 的 凡 个 变种 调度 算法 ， 但 是 
刚才 介绍 的 简单 的 贪 焚 方 案 在 仿真 测试 中 的 性 能 儿 乎 与 复杂 方案 一 样 。 


7.2.3 探查 


消息 可 以 发 送 给 系统 中 的 成 员 ， 以 定位 一 个 合适 处 理 器 来 调度 进程 ， 这 种 消息 称 为 控 
查 。 利 用 探查 消息 的 调度 算法 可 以 是 最 优 的 或 是 次 优 的 。 最 优 方案 的 实现 必须 探查 每 个 节点 
并 分 析 得 到 的 数据 ， 而 次 优 实现 可 以 有 选择 地 不 去 探查 所 有 节点 和 /或 有 选择 地 分 析 从 探查 [162 
消息 中 接收 到 的 完整 信息 。 如 果 每 个 节点 都 能 发 送 探查 消息 ， 则 算法 就 是 分 布 式 调度 算法 。 
反之 ,集中 式 服务 器 是 分 布 式 系统 中 惟一 的 发 送 探查 消息 和 维护 这 种 信息 的 角色 ， 则 算法 就 
是 集中 式 调度 算法 。 此 外 探查 消息 可 用 来 安放 进程 ， 或 用 来 评估 重 定位 的 可 能 性 ， 这 样 就 是 
以 适应 性 的 方式 执行 调度 。 最 后 ， 探 查 消息 可 以 被 欠 载 节点 用 来 寻找 更 多 的 工作 。 

一 个 使 用 探查 消息 的 调度 者 例子 见 [ELZ86]， 具 体 地 说 它 是 一 个 负荷 分 担 、 全 局 、 次 
优 、 启 发 式 的 静态 调度 算法 。 在 该 方法 中 ， 认 为 进程 的 定位 开销 比 通信 开销 更 重要 。 定 位 开 
销 是 将 进程 调度 到 与 原先 所 处 系统 不 同类 型 的 系统 有 关 的 开销 。 更 为 看 重 定 位 开销 的 理由 是 
因为 涉及 到 异 构 系 统 ， 即 在 不 同类 型 系统 上 执行 一 个 进程 的 有 关 开 销 。 当 然 如 果 进 程 代码 不 
能 移植 到 特定 节点 中 的 特定 宿主 系统 上 ， 则 该 节点 就 根本 不 予 考虑 。 

该 调度 算法 的 策略 涉及 到 利用 探查 消息 。 当 某 节 点 需要 远程 调度 或 迁移 一 个 进程 时 它 初 
始 化 三 到 五 个 探查 消息 〈 测 试 表明 更 多 的 探查 消息 不 能 显著 地 提高 性 能 )。 被 探查 的 节点 必 
须 是 与 发 送 探查 消息 的 系统 同 构 的 〈 用 权 值 来 影响 )。 在 同 构 系 统 可 用 时 ， 接 收 探查 消息 的 
节点 是 随机 选择 的 。 这 些 探查 器 测试 节点 的 探查 限制 ， 代 表 了 若 进程 迁移 到 该 节点 时 节点 将 
处 在 什么 样 的 负荷 状况 〈 见 第 2 章 所 述 ) 。 如 果 探 查 的 节点 限制 表明 节点 处 在 过 载 状 态 ， 则 
该 节点 就 会 被 排除 在 外 。 但 是 若 探查 的 节点 限制 表明 节点 处 在 欠 载 状态 ， 则 立即 进行 调度 将 
进程 迁移 到 该 节点 。 注 意 被 选择 节点 的 负荷 状况 在 发 送 探查 消息 时 刻 和 进程 迁移 到 达 时 刻 之 
间 可 能 会 发 生变 化 ， 这 不 会 也 不 能 影响 进程 迁移 决定 。 而 且 探查 没有 进行 寻找 和 确定 最 佳节 
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点 的 动作 。 此 外 探查 只 能 确定 节点 整个 的 负荷 状况 而 不 能 计算 负荷 状况 的 具体 值 或 索引 。 
7.2.4 调度 队列 


集中 式 操 作 系统 很 久 以 前 就 开始 使 用 调度 队列 ， 所 以 在 分 布 式 环境 中 使 用 该 方法 就 不 奇 
怪 了 。 当 使 用 调度 队列 时 ， 分布 式 调度 程序 一 般 维护 着 分 开 的 全 局 和 本 地 队列 。 本 地 队列 是 
存在 于 集中 式 系统 中 的 标准 队列 ， 维 护 着 在 本 地 运行 的 进程 列表 。 而 全 局 队列 是 用 于 非 指定 
本 地 调度 ， 而 是 预计 可 能 运行 在 整个 分 布 式 环境 中 的 进程 。 全 局 队列 是 否 允 许 进程 确认 执行 
环境 要 求 ， 例 如 希望 的 平台 或 机 器 ， 则 依 特定 的 实现 而 定 。 虽 然 每 个 节点 可 以 拥有 全 局 队列 
的 本 地 拷贝 ， 但 一 般 有 一 个 集中 式 服务 器 用 来 保存 和 更 新 全 局 队列 。 使 用 调度 队列 的 一 个 优 
点 是 使 用 调度 队列 的 调度 算法 可 以 很 容易 地 结合 到 现存 操作 系统 的 上 层 。 分 布 式 调度 程序 可 
以 简单 地 调用 一 个 将 被 调度 的 进程 。 当 调度 该 进程 时 ， 它 执行 分 布 式 调度 算法 ， 将 全 局 进程 
带 到 本 地 处 理 器 供 调度 。 在 没有 基层 操作 系统 时 ， 调 度 队 列 能 很 容易 地 实现 分 布 式 调 度 。 全 
局 与 本 地 调度 队列 将 如 何 由 系统 处 理 依赖 于 具体 操作 系统 的 策略 。 

使 用 调度 队列 的 调度 算法 的 一 个 例子 见 【Bla90]。 该 算法 涉及 到 Mach 中 使 用 的 处 理 器 
分 配 调度 。Mach 是 由 卡 大 基 - 梅 隆 大 学 开发 的 用 于 研究 的 分 布 式 操作 系统 。Mach E 由 开放 
软件 基金 组 织 (0SF) 所 接管 ， 该 操作 系统 的 大 部 分 已 结合 到 了 OSF/1 操作 系统 中 。 这 种 调 
度 算 法 是 可 以 用 于 负荷 平衡 或 负荷 分 担 的 强制 、 次 优 、 启 发 式 、 适 应 性 、 分 布 式 的 动态 调度 
算法 。 

调度 在 线程 级 进行 ， 每 个 节点 都 有 一 组 本 地 运 节点 1 
行 队列 和 一 组 全 局 运行 队列 。 每 个 单独 的 运行 队列 
表示 了 不 同 的 优先 级 ， 需 要 被 调度 的 最 高 优先 级 的 
线程 的 位 置 用 一 个 hint 变量 来 表示 ， 见 图 7-6 所 
示 。 这 样 如 果 0 级 的 到 4 级 的 优先 级 的 运行 队列 为 
空 ， 那 么 hint 变量 的 值 将 为 5， 表 示 的 是 包含 一 个 
线程 被 调度 的 最 高 优先 级 的 运行 队列 。 对 于 调度 目 
的 ， 最 高 优先 级 的 本 地 进程 由 调度 来 执行 。 线 程 优 
先 级 由 基本 优先 级 和 代表 最 近 处 理 器 利用 率 的 补偿 
值 组 成 ， 补 偿 值 也 反映 了 系统 的 当前 的 负荷 状况 。 
也 有 一 种 机 制 基 于 线程 的 年 龄 来 增 大 线程 的 优先 
级 。 每 个 运行 队列 包含 有 一 个 计数 器 用 于 它 所 维护 
的 线程 数目 和 互 斥 锁 数目 。 全 局 运行 队列 只 有 在 由 
队列 的 计数 器 表示 的 本 地 运行 队列 为 空 时 才 会 被 查 
找 。 如 果 没 有 本 地 运行 队列 ， 那 么 有 最 高 优先 级 的 
全 局 线程 就 会 被 调度 执行 。 本 地 运行 队列 用 于 限制 
在 特定 处 理 器 上 运行 的 线程 ， 如 果 一 个 线程 设计 成 ”图 7-6 带 有 运行 队列 和 hint 变量 的 节点 
用 在 特定 体系 结构 的 处 理 器 上 ， 那 么 它 就 可 能 是 那 种 受 限 制 的 线程 。Mach 共 使 用 32 个 运行 
队列 ， 最 小 数字 的 运行 队列 代表 最 高 的 优先 级 。 

Mach 调度 允许 使 用 由 用 户 提 供 的 hint 变量 。 具 体 地 说 ， 用 户 可 以 表达 不 提倡 提示 和 阻 
止 提 示 。 阻 止 提示 使 得 用 户 可 以 进行 并 发 控制 而 提高 系统 性 能 。 阻 止 提示 有 三 个 等 级 : 温和 
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级 、 强 烈 级 和 绝对 级 。 温 和 提示 建议 不 要 调度 -个 线程 或 将 线程 切换 出 去 。 而 强烈 提示 则 会 
暂时 地 减 小 特定 线程 的 优先 级 ， 这 通过 让 可 能 潜在 的 拥有 锁 的 线程 执行 以 希望 它 释放 出 锁 住 
的 资源 来 增加 并 发 控制 的 性 能 。 绝 对 提示 禁止 一 个 线程 在 限定 的 时 间 内 被 调度 ， 这 给 低 优先 
级 的 线程 提供 了 执行 的 机 会 。 如 果 低 优先 级 的 线程 拥有 一 个 高 优先 级 线程 需要 的 锁 ， 这 种 方 
法 就 可 以 让 低 优先 级 的 线程 执行 然后 释放 锁 。 

传递 提示 人 允许 线程 告诉 调度 程序 执行 一 个 特定 的 线程 而 不 是 提供 传递 提示 的 线程 。 该 新 
线程 马上 就 获得 对 处 理 器 的 控制 ， 这 样 就 旁 路 了 运行 队列 。 这 种 传递 可 以 由 原先 的 线程 显 式 
地 取消 或 最 终 超时 。 传 递 技术 也 在 低 优先 级 线程 控制 了 高 优先 级 线程 需要 的 并 发 控制 锁 时 很 
有 用 。 在 这 种 情况 下 ， 高 优先 级 线程 允许 将 处 理 器 传递 给 低 优先 级 线程 。 当 并 发 控制 锁 被 释 
放 后 ， 高 优先 级 线程 可 以 显 式 地 取消 传递 并 继续 进行 计算 ， 而 先前 被 锁 住 的 资源 这 时 就 可 
AT. 

为 了 允许 集体 调度 ，Mach 提出 了 一 个 称 为 处 理 器 集 的 抽象 概念 。 如 果 用 户 有 一 组 要 求 
集体 调度 的 线程 ， 就 可 以 将 它们 指派 给 特定 的 处 理 器 集 。 一 旦 将 某 个 线程 指派 给 一 个 处 理 器 
集 ， 它 就 必须 在 这 个 处 理 器 集中 执行 ， 而 且 处 理 器 集 只 能 运行 指派 给 它 的 线程 。 当 内 核 试 图 
调度 已 指派 给 某 处 理 器 集 的 线程 时 ， 它 利用 这 利信 息 来 分 配 特定 处 理 器 到 处 理 器 集 以 保证 所 
有 相关 线程 同时 调度 。 


7.2.5 随机 学 习 


随机 学 习 (Stochastic Learning) 是 基于 以 前 的 行为 来 确定 当前 的 最 佳 动作 的 启发 式 方法 ， 
即 从 经 验 中 学 习 。 所 有 的 调度 行为 与 一 个 概率 关联 。 分 布 式 系统 建立 时 ， 所 有 的 概率 都 初始 
化 为 相同 的 值 ， 这 些 概 率 用 来 选择 一 个 节点 。 在 作出 调度 选择 并 且 进 程 被 送 到 调度 的 节点 
后 ,目的 地 节点 提供 反馈 第 息 给 源 节点 。 根 据 对 调度 选择 的 评估 该 信息 可 以 奖励 点 数 或 罚 减 
点 数 。 如 果 目 的 节点 过 载 ， 则 它 就 会 发 送 消息 给 罚 点 ， 若 目的 节点 欠 载 它 将 发 送 消息 给 奖励 
点 数 。 这 些 点 数 可 以 用 来 为 刚才 的 行为 相应 地 调整 概率 ， 系 统 就 是 这 样 基于 奖励 /处 罚 反 馈 
来 进行 学 习 。 

这 种 方法 可 以 进一步 扩展 以 允许 调度 程序 记录 系统 状态 和 按照 系统 的 各 种 状态 来 行动 。 
整个 系统 的 每 个 可 能 状态 都 由 一 个 表 项 表示 成 一 个 自动 机 向 量 。 每 个 索引 代表 了 分 布 式 系统 
的 不 同 工 作 负荷 。 当 使 用 调度 算法 进行 调度 时 ， 向 量 的 内 容 同 与 节点 相关 的 概率 一 起 被 使 
用 。 对 自动 机 向 量 的 使 用 ， 要 求 节点 周期 性 地 报告 它们 的 负荷 状态 给 分 布 式 系统 中 的 各 个 成 
员 。 这 种 信息 用 来 计算 系统 的 状态 ， 保 证 了 当 进行 调度 决策 时 引用 的 是 正确 的 自动 机 表 项 。 
这 种 方法 可 以 利用 集中 式 服务 器 来 维护 自动 机 向 量 和 收集 到 的 工作 负荷 信息 ， 但 它 也 适合 于 
分 布 式 的 实现 。 

我 们 现在 讨论 一 个 如 [Kun91] 所 述 的 使 用 随机 学 习 自 动机 的 调度 算法 的 例子 ， 该 文 给 
出 了 一 个 强制 、 次 优 、 启 发 式 、 一 次 性 的 、 分 布 式 动 态 调度 算法 。 这 种 算法 当 本 地 处 理 器 处 
在 欠 载 状态 时 不 允许 进行 远程 调度 ， 而 且 如 果 分 布 式 系统 中 的 所 有 节点 都 处 在 过 载 状 态 时 也 
不 允许 进行 远程 调度 。 基 于 从 节点 中 收 到 的 活动 消息 计算 一 个 系统 范围 的 状态 ， 活 动 消息 被 
节点 用 来 传送 一 个 过 载 或 欠 载 状态 。 节 点 的 工作 负荷 状态 是 依据 当前 被 指派 给 节点 的 进程 的 
处 理 时 间 要 求 和 它们 的 输入 /输出 量 及 内 存 需求 而 定 。 该 算法 已 通过 以 下 的 工作 负荷 指标 的 
方法 进行 测试 : 
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4 平均 一 分 钟 的 负荷 ， 

4 剩余 内 存 空间 。 

4 CPU 的 空闲 时 间 量 ， 

4 上下文 切 换 的 频率 ， 

4 系统 调用 的 频率 。 

4 运行 队列 的 长 度 。 
工作 负荷 指标 按 效 果 增 加 的 顺序 给 出 。 这 样 节点 使 用 平均 一 分 钟 的 负荷 指标 时 效果 最 差 ， 而 
使 用 运行 队列 长 度 指标 时 效果 最 好 。Kuntz 发 现 两 个 指标 之 间 有 32% 的 响应 时 间 的 差别 。 另 
外 也 使 用 工作 负荷 指标 组 合 的 方法 测试 过 ， 但 实验 结果 未 反映 出 系统 响应 时 间 的 减少 。 

基于 工作 负荷 的 状态 信息 每 8 秒 钟 就 给 系统 中 的 节点 发 送 -次 ， 系 统 状态 就 计算 和 映射 
到 对 应 特定 自动 机 向 量 表 项 的 自动 机 状态 中 ， 这 个 表 项 以 后 就 用 到 调度 决策 中 。 当 调度 程序 
初始 化 时 所 有 的 概率 是 相同 的 ， 这 对 每 个 远程 节点 被 选择 出 来 执行 远程 进程 给 予 了 相同 的 可 
能 性 。 概 率 依据 从 选中 节点 反馈 的 奖励 或 处 罚 消息 来 进行 调整 ， 这 种 概率 以 后 就 用 于 随机 选 
择 将 进程 调度 到 那个 远程 节点 。 


7.3 协调 者 选举 


在 分 布 式 计算 的 每 个 与 集中 式 解 决 方案 有 关 的 问题 中 ， 有 一 个 集中 式 服务 器 在 系统 中 扮 
演 着 关键 的 角色 。 在 本 节 里 ， 我 们 介绍 用 来 确定 分 布 式 系统 中 的 哪个 特定 系统 充当 集中 式 服 
务 器 的 一 般 方 法 ， 而 且 该 方法 还 可 以 在 当主 服务 器 出 故障 时 用 来 指定 一 个 新 的 服务 器 。 引 用 
得 最 多 的 协调 者 选举 算法 是 由 Garcia - Molina 提出 的 [Gar82]， 那 篇 文章 将 选举 算法 称 为 
“欺负 算法 (Bully Algorithm)”， 该 算法 同 所 有 在 文献 中 给 出 的 调度 算法 一 样 需要 使 用 参与 者 
的 地 址 号 。 当 一 个 节点 注意 到 没有 服务 器 时 ， 节 点 发 送 消息 到 系统 中 的 所 有 成 员 要 求 成 为 协 
调 者 ， 这 种 消息 包含 有 节点 的 地 址 号 。 如 果 分 布 式 系统 中 大 号 地 址 的 任何 成 员 希 望 成 为 协调 
者 ， 则 大 号 地 址 的 节点 可 以 “欺负 ”小 号 地 址 的 节点 而 自动 地 成 为 协调 者 。 当 然 租 负 者 也 会 
被 分 布 式 系 统 中 更 大 号 地 址 的 另 一 个 成 员 坎 负 ， 见 图 7-7。 这 样 当 形势 紧急 时 大 号 地 址 的 节 
点 只 要 愿意 就 总 是 能 够 成 为 协调 者 。 如 果 没 有 节点 去 夺 走 小 号 地 址 节点 的 协调 者 地 位 ， 则 该 
小 号 地 址 的 节点 就 成 为 苏 调 者 。 协 调 者 欺负 舞 法 的 例子 见 详 级 说 明 7.3。 





详细 说 明 7. 3 
一 个 娩 负 协调 者 算法 





or 


Se 











ies 
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IF-noresponse from tioordinator 

THEN forall (participant address) 
send(I want to be coordinator, my address) & 
settimer 


等 待 应 答 


IE receive message å recipient address>my address 
THEN: cannot be ‘coordinator | : : 
ELSE. . IF timer xpired ~ 

THEN I am coordinator 














节点 1 想 要 成 为 协调 者 。 
对 不 起 ， 我 是 节点 4 并 且 我 也 希望 成 为 
协调 者 。 

， 我 是 节点 7 4 


成 为 协调 者 


7-7 欺负 算法 


这 种 同样 的 过 程 不 但 可 以 在 协调 者 失效 时 进行 ,而且 在 选举 新 协调 者 时 也 可 以 进行 。 该 
算法 的 一 种 变种 是 只 发 送 消息 给 地 址 号 比 自己 大 的 节点 ， 而 不 是 所 有 节点 ， 因 为 小 号 地 址 的 
节点 不 能 阻止 特定 成 员 成 为 协调 者 。 节 点 的 地 址 在 网 络 安装 时 就 已 确定 ， 并 且 一 般 对 于 系统 
来 说 是 不 可 改变 的 ， 这 样 就 不 允许 节点 改变 它 的 地 址 来 “插队 ”。 总 之 地 址 号 大 就 能 允许 特 
定 分 布 式 系统 成 员 统治 系统 并 每 次 都 成 为 协调 者 。 
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7.4 IMLE 


分 布 式 环境 中 的 一 个 重要 问题 是 对 孤儿 进程 (Orphan Process) 的 处 理 ， 这 个 问题 最 初 是 
在 [Nel81] 中 提 及 。 在 当 父 进程 过 早 地 终止 时 就 会 生成 孤儿 进程 ， 对 于 远程 过 程 调 用 这 个 
问题 就 更 常见 。 

任何 由 终止 进程 创建 的 进程 都 是 子 进程 ， 它 将 继续 执行 下 去 ， 除 非 分 布 式 系 统 的 进程 管 
理 中 包含 菜 种 处 理 孤儿 进程 的 机 制 。 孤 儿 进 程 是 没有 人 接受 其 返回 值 的 进程 。 而 且 ， 子 进程 
甚至 也 可 以 创建 自己 的 子 进程 ， 这 样 就 将 问题 进一步 复杂 化 了 。 当 一 个 进程 在 进行 没有 父 进 
程 的 执行 时 ， 它 会 浪费 资源 和 破坏 数据 。 浪 费 的 资源 最 常见 为 CPU 周期 ， 还 有 网 络 及 存储 
资源 。 此 外 孤儿 进程 会 以 不 可 赣 的 方式 修改 共享 数据 。 如 果子 进程 控制 了 某 种 类 型 的 并 发 控 
制 锁 ， 则 当 告 诉 它 终止 热 行 时 ， 它 就 必须 释放 所 有 锁 ， 但 是 这 不 能 保证 数据 不 被 不 可 逆 地 破 
坏 。 在 前 面 学 习 调 度 时 我 们 知道 进程 可 以 被 调度 到 整个 分 布 式 系统 中 的 任何 地 方 ， 这 样 这 些 
孤儿 进程 可 以 在 整个 分 右 式 系统 中 的 任何 地 方 执行 。 我 们 以 下 介绍 管理 及 处 理 孤儿 进程 的 三 
种 方案 。 


7.4.1 现 儿 进程 清除 


孤儿 进程 清除 要 求 当 进程 在 系统 或 硬件 出 省 后 苏醒 过 来 时 清除 它 所 创建 的 子 进程 。 为 了 
完成 这 个 操作 ， 进 程 必须 保存 所 有 它 所 创建 的 进程 的 清单 。 父 进程 可 以 要 求 它 的 所 有 的 子 进 


A. 家 族 树 在 父 进程 所 在 的 节点 _- 
进程 | 的 宿主 节点 
”进程 ! 的 家 族 树 






B. 分 布 式 家 族 树 
TAA 








图 7-8 孤儿 清除 的 家 族 树 
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程 在 创建 子 进程 时 通知 父 进程 或 要 求 子 进程 保存 自己 的 子 进程 清单 ， 如 图 7-8 所 示 。 在 任何 
一 种 情形 下 ， 这 种 家 族 树 都 必须 保存 在 稳定 存储 器 中 。 当 系统 恢复 后 ， 它 检查 家 族 树 以 确定 
在 它 崩 省 时 刻 正在 执行 的 进程 。 这 时 清除 操作 必须 开始 ， 内 为 家 族 树 的 所 有 成 员 都 被 通知 了 
它们 的 父 进程 已 经 死亡 并 停止 执行 。 如 果 要 求 子 进程 维护 自己 的 家 族 树 ， 则 它 必须 通知 它 所 
有 的 子 进程 终止 执行 。 

这 种 方法 的 最 大 的 缺点 之 一 是 它 给 父 进程 所 在 的 节点 带 来 了 巨大 的 负担 。 这 种 负担 不 








| 详细 说 明 7.4 
ULI 











在 家 族 树 中 记录 入 口 





Repeat. forever 


Foreach process{PID) 


< HEID ARALI 6 

1/ 对 于 每 个 进程 都 必须 执行 这 个 操作 
IF system created (PID) 

AH Fiet 系统 是 其 父 进程 ， 


pm 


Create tantly. tree (PID); 
Flughifamily tree, st able storage) 


amt A 


add (PID; process table}; 


ee 


} 
ELSE 
f 





// 这 不 是 一 个 系统 创建 的 进程 ， 
而 是 夯 一 个 进程 的 于 进程 


parent = look up parent (PID) 
' add to tree (parent, PID). < 


H 将 新 进程 加 入 到 它 的 父 进程 的 家 族 树 中 
_WELSE 结束 ， 需要 添加 到 父 进程 的 家 族 树 中 
pee etak 
ee 


Foreach ‘process: ig: proces table Z 











| foreach proc ese i ree (PID) 
: send clean up message; 


Th 止 运行 
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但 包括 家 族 树 必 要 的 存 健 开 销 ， 而 且 还 包括 不 断 更 新 家 族 树 和 维持 家 族 树 的 准确 性 所 需要 的 
开销 。 扳 儿 进 程 清除 算法 的 一 个 例子 见 详细 说 明 7.4。 


7.4.2 子 进程 限额 


管理 孤儿 进程 的 第 二 种 方法 要 求 所 有 的 子 进 
程 得 到 称 为 子 进程 限额 的 时 间 限 额 ， 这 种 限额 给 
子 进 程 提供 了 有 限 数量 的 时 间 来 运行 。 当 限额 用 
完 时 ， 子 进程 必须 从 父 进 程 那里 请 求 另 一 个 限额 ， 
如 果 父 进程 已 经 终止 ， 则 子 进程 就 不 能 获得 限额 ， 
这 样 它 就 不 能 继续 执行 ， 如 图 7-9 所 示 。 若 父 进 
程 仍 然 是 活动 的 ， 则 父 进 程 将 会 给 该 子 进程 分 配 
一 个 时 间 限 额 。 同 样 地 子 进程 可 以 创建 自己 的 子 
进程 ,这些 第 二 代 和 可 能 的 第 三 代 子 进程 可 以 从 
它 的 父 进程 或 继父 进程 中 获取 限额 。 当 子 进程 提 
供 限 额 给 它 自 己 的 子 进 程 时 ， 它 不 可 以 提供 超过 
自己 剩 下 的 限额 加 上 少量 的 机 动 时 间 之 和 。 这 人 少 





量 的 机 动 时 间 使 得 直系 父 进 程 在 接收 到 它 的 子 进 ral 
程 的 请 求 之 前 可 以 获取 它 自己 的 限额 。 未 获得 限 et 
额 的 子 进程 不 能 提供 限额 给 它 自己 的 子 进 程 。 这 

样 ， 当 一 个 父 进程 过 早 终止 时 ， 它 的 所 有 后 代 进 l 

程 由 于 缺乏 限额 而 最 终 将 会 终止。 ne 


3 


虽然 这 种 方法 不 需要 花费 父 进程 所 在 系统 的 
大 量 开销 ， 但 是 它 导 致 了 额外 的 网 络 流量 。 而 且 
它 会 干涉 子 进程 的 执行 ， 子 进程 需要 不 时 地 停 下 图 7-9 子 进程 限额 
来 请 求 限额 。 此 外 当 系 统 从 崩溃 状 态 中 进行 恢复 
时 ， 它 不 能 马上 就 开始 执行 进程 。 如 果 它 马上 开始 执行 ， 衣 溃 前 的 子 进 程 可 能 会 请 求 限额 ， 
这 样 父 进程 就 不 能 将 它 的 子 进程 与 在 系统 崩溃 前 就 成 为 孤儿 的 进程 区 分 开 来 。 因 此 系统 必须 
在 崩溃 后 开始 的 任何 进程 执行 之 前 等 待 一 个 限额 周期 。 


7.4.3 进程 版 本 号 


进程 版 本 号 可 用 来 区 分 一 个 已 般 省 进程 的 子 进程 和 进程 在 崩溃 后 产生 的 子 进程 ， 这 种 方 
法 需要 每 个 进程 保存 一 个 父 进程 的 版 本 号 。 当 系统 前 涡 时 ， 它 宣告 一 个 新 的 版 本 号 给 整个 分 
布 式 系统 ， 这 样 就 有 两 种 实现 方案 可 用 于 处 理由 该 系统 创建 的 子 进程 : 

1. 可 以 强迫 子 进程 终止 运行 ， 因 为 它 有 着 过 时 的 版 本 号 ， 见 图 7-10 所 示 。 

2. 子 进程 可 以 首先 定位 它 的 父 进程 (从 它 创建 后 可 能 会 迁移 )， 如 果 不 能 定位 父 进 程 ， 
则 子 进程 必须 终止 运行 。 

在 这 两 种 情况 下， 该 方法 在 每 次 系统 失效 时 都 需要 进行 大 量 的 通信 ， 而 且 和 以 前 崩溃 的 
系统 没有 任何 联系 的 系统 也 必须 接收 和 处 理 宜 告 新 版 本 号 的 消息 。 
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A 节点 A 创建 2 个 进程 


BRAM. FABRA C 都 有 版 本 


号 为 1 的 活动 进程 
节点 日 
= 
| HAC 


C 节点 ASE, TAB 和 节点 C 终止 


版 本 号 过 时 的 进程 
节点 B 
版 本 2 
HALA [ 终止 P.V 
| 节点 C 


图 7-10 进程 版 本 号 
7.5 小 结 


在 本 章 中 ， 我 们 深入 讨论 了 分 布 式 进程 管理 的 各 个 方面 。 具 体 地 说 ， 我 们 讨论 了 分 布 式 
进程 调度 所 涉及 的 问题 ， 集 中 式 算 法 当中 选举 协调 者 进程 ， 以 及 处 理 孤 儿 进 程 所 涉及 的 问 
题 。 当 设计 一 个 控制 进程 指 汽 到 远程 节点 的 分 布 式 进程 调度 算法 时 ， 有 多 种 选择 方案 可 用 。 
由 于 选择 的 多 样 性 ， 可 以 有 忆 种 不 同类 型 的 调度 算法 。 一 些 算法 很 自然 地 用 于 多 种 调度 算 
法 类 型 而 另 一 些 则 不 能 。 具 体 地 说 ， 虽 然 最 优化 算法 由 于 执行 起 来 速度 慢 而 一 般 不 采用 ， 但 
是 所 有 能 用 于 一 次 性 调度 算法 的 算法 均 可 以 用 于 适应 性 调度 。 一 些 算法 就 调度 方案 绑 定 时 间 
而 言 并 不 特别 ， 而 另 一 些 ， 创 如 探查 算法 利用 了 进程 绑 定 的 系统 类 型 ， 这 样 在 确定 可 以 执行 
远程 节点 时 能 够 减少 节点 搜索 空间 。 所 有 调度 算法 使 用 的 方法 都 可 用 于 负荷 平衡 和 负荷 分 
担 ， 而 且 可 以 使 用 这 些 方法 的 组 合 。 例 如 随机 学 习 可 以 很 容易 地 改 为 同 探查 算法 一 起 作用 ， 
而 代替 由 每 个 节点 广播 它 的 负荷 状态 。 可 以 将 图 论 方法 应 用 于 随机 学 习 的 初始 调度 信息 。 使 
用 点 数 可 以 用 来 确定 进程 的 优先 级 并 同调 度 队 列 结合 在 一 起 使 用 。 尽 管 对 于 调度 已 经 进行 了 
大 量 的 研究 并 有 许多 可 用 的 信息 ， 但 目前 它 仍然 是 一 个 非常 活 啤 的 研究 领域 。 一 些 比 较 困 难 
的 问题 涉及 到 工作 负荷 描述 的 定义 和 它们 相应 的 反映 节点 负荷 状况 的 阐 值 。 另 外 的 一 些 研 究 
工作 主要 是 改进 调度 算法 的 效率 。 

关于 协调 者 选举 ， 通 用 的 规则 是 资深 惯例 。 资 历 以 节点 的 地 址 来 确立 ， 地 址 号 越 大 的 节 
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点 其 资历 就 越 老 。 如 果 一 个 节点 有 最 大 的 地 址 号 并 且 它 想 做 额外 的 工作 ， 则 协调 者 选举 算法 
通常 就 多 许 该 节点 成 为 协调 者 。 另 一 方面 ， 处 理 孤儿 进程 不 是 一 件 容 易 的 事情 ,每 种 处 理 方 
法 都 有 缺点 ， 但 是 这 些 缺 点 都 未 超过 不 使 用 孤儿 进程 处 理 方法 所 带 来 的 损害 。 当 我 们 讨论 各 
种 用 于 终止 进程 的 方法 时 ， 都 没有 论 及 这 些 终止 方法 将 会 如 何 影响 数据 的 问题 ， 这 种 问题 可 
以 用 一 个 词 来 回答 : 事务 (这 个 主题 在 第 9 章 讨论 )。 

最 后 ， 要 强调 的 是 分 布 式 进程 管理 仍然 是 一 个 活路 的 研究 领域 ,而且 还 没有 特别 好 的 解 
决 方案 出 现 。 除 了 在 本 章 讨论 的 主题 之 外 ， 还 有 以 下 领域 仍然 需要 重点 研究 ， 

4 怎样 才能 最 好 地 解决 处 理 器 拥塞 。 

4 怎样 处 理 、 确 定 和 防止 局 部 系统 过 载 。 

4 怎样 确定 理想 的 进程 级 粒度 和 用 有 效 的 算法 来 处 理 这 个 问题 大量 的 小 进程 分 布 处 理 

会 比分 布 式 处 理 方 法 带 来 更 多 的 问题 )。 

4 怎样 确定 理想 级 的 处 理 嚣 粒度 。 

考虑 到 这 些 相 对 未 解决 的 问题 以 及 本 章 介绍 的 这 些 主题 ， 所 以 说 分 布 式 进程 管理 在 实践 
中 仍 是 一 个 困难 的 主题 ， 但 同时 又 不 失 为 一 个 非常 好 的 研究 、 基 金 资助 以 及 学 位 论文 题目 的 
领域 。 或 许 解决 的 答案 在 于 采用 不 同学 科 的 方法 ， 例 如 商业 管理 〈 分 割 和 分 布 (或 委托 ) I 
作 负 荷 是 管理 科学 的 一 个 常见 的 问题 )。 


7.6 参考 文献 


文献 [BGMR96] 和 和 [BuScSu97, Kop97, and SSRB98] 分 别 为 分 布 式 调度 算法 和 实时 调度 
提供 了 更 详尽 的 具体 的 算法 分 析 信 息 。 一 些 与 本 章 内 容 有 关 的 传统 的 研究 论文 包括 
[ ArFi89, Bla90, CaKu38, EAL95, ELZ86, Esk89, Fer89, FeZh87, FYN88, Gar82, KrLi87, 
Kun91, LHWS96, Lo88, Muli87, Nel81, Ous82, PaSh88, PTS88, SHK95 (一 组 经 典 论文 )， 
SKS92, VLL90, 和 WaMo85]. 

在 第 1 章 列 出 的 Internet 搜索 站 点 提供 了 Intemet 中 与 分 布 式 进程 管理 有 关 的 资源 的 最 佳 
的 起 始点 。 


习题 


7.1 指定 负荷 分 布 目 标 对 负荷 平衡 的 不 利 方面 是 什么 ? 

7.2 在 分 布 式 系 统 中 可 能 实现 真正 的 负荷 平衡 吗 ? 它 有 必要 实现 吗 ? 为 什么 ? 

7.3 ERIM, 我 们 介绍 了 用 工作 站 模型 和 处 理 器 池 模 型 实现 C/S 环境 的 概念 ， 哪 种 
模型 更 有 助 于 实现 负荷 平衡 的 目标 ? 为 什么 ? 

7.4 列举 三 种 提高 调度 效率 的 可 行 措施 ， 并 列举 每 种 措施 至 少 一 条 优点 和 一 条 缺点 。 

7.5 列举 次 优 近 似 方案 与 次 优 启发 式 方案 相 比 的 一 个 优点 ， 列 举 次 优 启发 式 方案 与 次 
优 近 似 方案 相 比 的 一 个 优点 。 

7.6 在 分 布 式 系统 中 哪 种 处 理 器 绑 定 时 间 类 型 更 好 ? 为 什么 ? 

7.7 在 分 布 式 调 度 算法 中 简单 使 用 点 和 经 济 使 用 点 方法 相 比 ， 其 优 缺 点 各 是 什么 ? 

7.8 为 用 于 分 布 式 调度 的 简单 使 用 点 方法 写 一 个 仿真 程序 ， 如 果 两 个 进程 属于 具有 相 
等 使 用 点 的 节点 ， 则 使 用 先 到 先 服务 原则 。 程 序 应 当 从 一 个 文件 中 读 取 输入 ， 希 
望 的 输入 的 格式 如 下 : 
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时 间 节点 进程 号 

时 间 表 示 事 件 发 生 的 时 间 ， 节 点 指定 引发 事件 的 位 置 ， 进 程 号 用 来 确定 特定 进 
程 。 如 果 进 程 号 的 值 为 0， 则 事件 表明 该 节点 为 进程 执行 提供 帮助 ， 任 何 非 0 进 
程 号 都 表明 进程 需要 帮助 。 程 序 的 输出 应 当 包括 一 个 表明 何 时 事件 发 生 ， 何 时 在 
某 节 点 上 的 一 个 进程 被 调度 及 节点 号 的 相关 信息 。 此 外 ， 程 序 应 当 表 明 何 时 节点 
收取 和 支付 使 用 点 ， 以 及 每 个 节点 的 最 终 使 用 点 列表 。 可 以 假定 有 一 个 集中 式 服 
务 器 来 维护 使 用 表 ， 也 可 以 假定 如 果 一 个 节点 需要 帮助 而 没有 节点 可 提供 帮助 则 
也 向 它 收取 一 个 使 用 点 。 用 至 少 四 个 不 同 的 测试 文件 来 测试 你 的 程序 ， 注 意 每 个 
测试 文件 的 侧重 点 不 一 样 。 

本 文中 讨论 的 用 于 进程 调度 的 图 论 方法 是 一 种 集中 式 解决 方案 ， 请 问 若 将 这 种 方 
法 用 分 布 式 方案 来 实现 会 遇 到 什么 困难 ? 

为 什么 Lo 的 [Lo83] 的 调度 算法 是 一 种 近似 方法 ? 说 明 你 的 理由 。 

[ELZ86] 中 所 述 的 探查 算法 的 例子 是 优先 考虑 定位 开销 ， 它 的 优点 是 什么 ”其 可 
能 的 缺点 又 是 哪些 ? 

当 在 分 布 式 调度 中 利用 本 地 和 全 局 调度 队列 时 ， 为 什么 首先 调度 本 地 队列 ? 其 优 
缺点 各 是 什么 ? 将 提示 变量 hint 结合 到 使 用 队列 的 分 布 式 调度 算法 的 优点 是 什 
么 ? 

请 阐述 Mach 调度 允许 使 用 用 户 提示 的 潜在 优点 ， 并 给 出 一 种 可 行 的 替代 方案 。 
请 阐述 在 随机 学 习 的 调度 算法 中 使 用 自动 机 向 量 的 优点 ， 不 使 用 自动 机 向 量 的 方 
法 的 缺点 是 什么 ? 

指定 一 个 过 载 的 节点 为 协调 者 会 对 分 布 式 系统 的 性 能 带 来 损害 ， 坎 负 算 法 是 怎样 
选择 合适 的 系统 成 为 协调 者 的 ? 

请 阐述 处 理 孤 儿 进程 的 三 种 方法 的 优 缺点 。 
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第 8 章 分 布 式 文件 系统 


在 操作 系统 中 ， 文 件 系 统 是 非常 重要 的 子 系统 。 该 子 系统 提供 了 辅助 存储 器 的 抽象 视图 
并 负责 全 局 命名 、 文 件 访问 和 全 面 的 文件 组 织 。 这 些 功 能 分 别 由 名 字 服 务 (8.1 节 )、 文 件 
管理 器 服务 (8.247) 及 目录 服务 (8.3 节 ) 来 提供 。 虽 然 分 布 式 文件 系统 的 实现 必须 提供 
这 些 服务 ， 但 是 它们 不 需要 在 不 同 的 服务 器 中 实现 。 除 了 分 布 式 文件 系统 需要 提供 的 服务 
外 ， 本 章 还 介绍 两 个 著名 的 分 布 式 文件 系统 实现 的 实例 ， 它 们 是 8.4 节 中 的 网 络 文件 系统 
(NFS) 和 8.5 节 中 的 X.S00 规范 。 


8.1 分 布 式 名 字 服 务 


分 布 式 名 字 服 务 主要 是 涉及 与 文件 名 有 关 的 问题 ， 一 个 常见 的 问题 是 “文件 名 是 什 
么 ?” ， 分 布 式 文件 系统 会 反问 “你 打算 让 文件 名 传达 什么 信息 ?"。 文 件 名 可 以 传达 文件 类 型 
及 文件 所 在 位 置信 息 。 我 们 将 在 8.1.1 节 讨 论文 件 的 类 型 ，8.1.2 节 介绍 位 置 透 明 性 及 实现 
位 置 透 明 性 的 必要 的 要 求 ， 全 局 命名 和 命名 透明 性 在 8.1.3 节 讨论 。 


8.1.1 文件 类 型 


各 种 操作 系统 允许 不 同类 型 的 文件 和 以 不 同方 式 支持 文件 系统 。 在 文件 名 中 ， 文 件 类 型 
一 般 通 过 文件 名 中 “.” 后 的 部 分 一 一 扩展 名 来 表达 。 准 确 的 扩展 名 通常 认为 是 一 种 惯例 而 
非 规 定 ， 尽 管 某 些 应 用 需要 通过 它们 来 识别 文件 。 以 下 列 出 了 部 分 常见 的 文件 类 型 及 可 能 的 
扩展 名 ， 
4 库 文 件 : 可 在 用 户 程序 中 使 用 的 通用 例 程 ， 这 种 文件 使 用 扩展 名 lb 和 dll 等 。 
4 程序 文件 : 用 户 所 写 的 程序 。 这 种 文件 使 用 扩展 名 来 表明 所 使 用 的 特定 程序 语言 ， 例 
Mc, cpp, p 和 pas. 
$9 目标 代码 文件 ， 未 链接 的 、 已 编译 过 的 、 通 常 以 机 器 语言 表示 的 程序 ， 这 种 文件 使 用 
的 扩展 名 有 o 和 obj. 
4 压缩 文件 : 为 了 节省 存储 空间 而 进行 压缩 的 文件 ， 这 种 文件 使 用 扩展 名 Z, ap 和 gz 等 。 
4 存档 文件 : 相关 的 文件 为 了 便于 存储 而 组 合成 的 单个 文件 ， 这 种 文件 使 用 扩展 名 tar 
或 arc 等 。 
4 图 形 图 像 文 件 : 用 于 打印 和 浏览 的 二 进 制 或 AsSCI 文件 ， 这 些 文件 常用 的 扩展 名 有 
dvi, ps, gif, FE jpeg 等 。 
4 声音 文件 : 保存 声音 数据 的 二 进 制 文件 ， 这 种 文件 使 用 扩展 名 midi 和 wav 等 。 
4 索引 文件 : 索引 文件 通常 包含 其 他 主机 的 索引 信息 ， 这 种 文件 使 用 扩展 名 idro 
4 文档 文件 : 由 字 处 理 器 创建 的 文件 或 由 排版 系统 转换 成 的 文件 ， 这 种 文件 常用 的 扩展 
名 有 doc, up, tex 等 。 
名 字 服 务必 须 允 许 所 有 可 能 的 文件 类 型 。 某 些 操作 系统 为 不 同 的 文件 类 型 提供 支持 。 例 
如 某 些 操作 系统 能 够 识别 二 进 制 文件 ， 但 不 允许 用 户 浏览 上 述 类 型 的 文件 。 而 其 他 操作 系统 
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为 一 个 给 定 的 文件 类 型 调用 适当 的 应 用 程序 。 茶 些 编 举 嚣 不 编译 未 以 正确 的 文件 名 结 吉 尾 的 程 
序 。 在 UNIX 中 有 了 两 种 另外 的 、 不 是 通过 扩展 名 来 区 分 的 文件 类 型 : 文件 名 以 “.” 文 件 开 
头 的 不 可 见 文件 和 目录 。 当 系统 自动 地 调用 应 用 程序 时 ， 如 果 有 可 能 会 损害 系统 的 灵活 性 ， 
从 而 会 损害 用 户 的 灵活 性 时 ， 文 件 类 型 支持 是 很 有 用 的 。 具 体 地 说 ， 如 果 本 来 就 支持 文件 类 
型 ， 那 么 每 个 新 的 文件 类 型 必须 连同 它 的 应 用 程序 信息 一 起 报告 给 操作 系统 。 这 种 全 面 文件 
的 类 型 支持 使 得 操作 系统 在 支持 以 后 出 现 的 新 文件 类 型 时 变 得 很 困难 。 


8.1.2 位 置 透明 


文件 名 能 传达 的 第 二 种 信息 是 文件 的 位 置 。 如 果 文 件 的 位 置 被 传送 ， 则 名 字 中 可 以 包括 
位 置 、 机 器 和 文件 名 ， 例 如 myuniversity .edu: /violet/u/galli/book/chapter8。 若 分 布 式 系统 希望 
提供 位 置 透明 ， 那 么 必须 通过 全 局 命名 ( 见 8.1.3 节 ) 来 提供 名 字 透 明 。 位 置 透明 性 依赖 于 
名 字 与 位 置 独立 ， 这 是 非常 重要 的 而 不 是 无 关 紧 要 的 。 设 想 如 果 电 话 号 码 是 位 置 独立 的 ， 那 
么 电话 号 码 中 就 再 也 不 需要 区 号 了 ， 因 为 区 号 是 用 来 表明 电话 号 码 持 有 人 所 在 的 位 置 。 其 优 
点 是 如 果 你 迁 到 你 们 国家 的 另 一 个 地 方 或 迁 到 另 一 个 国家 时 你 的 电话 号 码 不 用 改变 ， 所 有 在 
你 搬迁 之 前 知道 你 的 号 码 的 人 仍然 可 以 与 你 联系 上 而 无 需 知 道 你 已 搬家 。 这 显然 是 很 方便 
的 ， 特 别 是 对 于 一 个 经 常 括 家 的 人 来 说 。 这 种 号 码 称 为 统一 号 (universal number)， 如 号 码 
800 和 888。 同 样 地 ， 在 一 个 分 布 式 系统 中 文件 可 能 会 迁移 到 一 个 新 的 位 置 或 一 个 文件 在 整 
个 系统 会 存在 多 份 拷贝 。 若 没有 位 置 透明 性 ， 用 户 和 /或 他 们 的 系统 将 需要 不 断 地 跟踪 每 个 
文件 的 每 份 拷贝 的 位 置 ， 并 显 式 地 表示 出 文件 的 位 置 以 进行 文件 访问 ， 这 将 极 大 地 损害 分 布 
式 操作 系统 的 基本 思想 ， 因 为 分 布 式 操作 系统 的 根本 目标 就 是 提供 统一 的 系统 视图 ， 这 样 就 
可 以 隐藏 存在 多 个 系统 和 驳 个 节点 的 事实 。 详 细 说 明 8.1 描述 了 位 置 透 明 性 缺点 的 一 个 实 
fil: 路 由 。 








详细 说 明 8.1 
位 置 透明 性 的 路 由 问题 











位 置 透明 性 的 一 个 问题 涉及 到 信息 的 路 由 。 当 名 字 中 包含 有 位 置信 息 时 ，: 这 种 信息 
可 以 用 来 帮助 路 由 ， 而 不 需要 有 完整 的 主 名 到 位 置 的 转换 老 。 我 们 讨论 IPv4〈 因 特 网 协 
BORA 4) 和 将 耳 地 址 的 使 用 与 电话 号 码 的 使 用 相 比 较 ， 作 为 路 由 在 位 置 透明 情况 下 通 
到 困难 的 例子 。 中 地 址 不 提供 任何 位 置 的 信息 而 电话 号 码 则 提供 位 置信 息 。 注 意 到 任何 
使 用 文件 名 描述 及 转 地 址 的 命名 系统 都 不 提供 位 置 透明 性 是 很 重要 的 。 这 种 文件 名 依 囊 
PHL, 如果 它 迁移 到 由 四 地 址 来 标识 的 另 一 个 节点 ， 则 文件 名 需要 改变 。 此 外 ， 
加 果 特 定 节点 显示 或 创建 一 个 跟 它 的 田地 址 数 相 关 的 位 置 ， 则 该 节 志 就 消除 了 路 由 的 位 
FENER A, PARIAR, 则 路 由 系统 就 会 引发 异常 消息 或 要 求 重 新 指定 一 个 地 
址 号 。 对 于 这 个 例子 ， 我 们 只 讨论 肥 地 址 (没有 层次 结构 的 ) 同 非 统一 电话 叶 码 的 比较 。 

我 们 首先 介绍 提供 位 置信 息 的 电话 号 码 是 怎样 对 路 由 提供 帮助 的 。 电 话 号 码 提 供 了 
以 下 三 级 位 置信 息 ; (1) 国家 代码 ; (2) RARA (RF); (3) 本 地 交换 码 。 前 两 级 号 
码 是 可 选 的 ， 并 且 如 果 没有 被 包括 进来 就 假定 目的 总 与 源 端 有 相同 的 前 两 级 号 码 值 。 电 
A pt pp ee hs CAATEA 
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的 大概 往 置 ， 则 基于 本 地 交换 码 特定 的 位 置 将 进 一 FARM, 一旦 将 呼叫 交换 到 了 恰当 
的 本 地 交换 局 ， 那么 基 : 于 最 后 的 几 位 数字 呼叫 就 可 交换 到 确切 的 位 置 。 如 果 接 收 到 一 个 
不 是 对 本 地 位 置 are], A BMRA 是 基于 以 下 规则 将 呼叫 简单 地 切换 到 适当 的 位 置 ; 
L 如 果 只 的 目的 地 是 在 我 的 区 域 号 码 内 但 交换 局 不 同 ， 则 将 呼叫 切换 到 相应 的 交 
Be. 
2. bRo1H AHEM CRSA EMS SAA, 但 是 属于 我 国 的 一 AB, 
Pere Tre 
3 各 果 呼叫 目的 地 是 外 同 ， 则 将 呼叫 切换 到 相应 的 国家 。 

在 相应 层次 上 接收 再 呼 4 时 ， LENS ate" 交换 到 相应 的 BBR EB. 变换 局 
+, 如 图 8-1 所 示 。 





epy SB aa- 123-467 
FERRE 
RP BERET 
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为 国家 代码 1 
| 
为 区 域 代码 2 | 
路 由 的 交换 机 | 


为 交换 局 代码 
23 路 由 的 
交换 机 











-8 Me 站 
有 超过 二 百 万 个 的 机 器 得， 这 和 多 可 的 示人 党 大 。 一 种 对 四 地 址 的 儿 助 方法 是 使 用 符合 
域名 系统 规范 的 符号 名 字 ， 见 详细 说 明 8.2。 
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8.1.3 全 局 命名 与 名 字 透 明 


一 个 支持 位 置 透明 的 分 布 式 文件 系统 必须 支持 全 局 命名 。 但 是 ， 全 局 命名 本 身 并 不 意味 
着 位 置 透明 。 具 体 地 说 ， 全 局 命名 分 配 每 个 文件 (或 对 象 ) 一 个 全 局 惟一 的 名 字 。 如 果 该 全 
局 惟一 名 字 是 位 置 /机 器 名 /文件 名 ， 则 系统 就 不 支持 位 置 透明 。 对 于 一 个 支持 位 置 透 明 的 系 
统 ， 它 必须 也 同时 支持 名 字 透 明 。 名 字 透 明 也 需要 全 局 惟一 的 名 字 ， 但 这 种 名 字 不 能 以 任何 
方式 包含 位 置 的 任何 信息 。 有 时 会 错误 地 认为 名 字 可 以 同 服务 器 相关 联 ， 并 且 仍 然 能 提供 名 
字 透 明 。 但 是 如 果 服 务 器 名 字 包 含 在 文件 名 中 ， 那 么 文件 就 要 求 一 直 保 留 在 那个 特定 的 服务 
器 上 。 这 限制 了 整个 系统 的 灵活 性 并 妨碍 了 位 置 透明 ， 因 为 这 种 安排 将 禁止 文件 迁移 到 另外 
的 服务 器 上 。 

全 局 名 字 空 间 需 要 以 下 的 一 种 或 两 种 类 型 的 解析 : 

4 名 字 解 析 。 

4 位 置 解析 。 

名 字 解 析 是 将 用 户 友好 的 符号 文件 名 映射 到 计算 机 文件 名 。 符 号 文件 名 习惯 上 涉及 到 字 
符 ， 而 计算 机 文件 名 通常 (不 是 非常 用 户 友好 的 ) 是 数字 。 虽 然 数 字 可 以 更 加 容易 地 被 计算 
机 处 理 ， 但 这 种 方法 在 人 类 用 户 中 并 不 流行 9。 这 样 每 个 全 局 惟一 数字 名 字 必 须 映 射 到 一 个 
全 局 惟一 的 基于 字符 的 名 字 。 在 第 6 章 中 我 们 学 习 过 Clouds 和 Amoeba 是 怎样 实现 全 局 命名 
的 ， 有 具体 地 说 两 个 系统 都 提供 了 (二进制 ) 数字 的 全 局 惟一 名 字 ， 这 些 非 用 户 友好 的 名 字 自 
AMORA T APACHE) (ASCH) AF. BA P 没有 涉及 到 文件 名 解析 ， 但 它 为 全 局 名 
字 解 析 实 现 提供 了 一 个 极 好 的 实例 ， 见 详细 说 明 8.2。 


详细 说 朋 82 
Pagen 








“Pet SEMA MEMES (DNS) 来 执行 ， 这 个 系统 用 来 将 DP 地 址 解析 到 符号 名 
字 ， 它 基于 层次 符号 名 字 宝 间 ， 如 图 8-2 所 示 。 每 个 符号 名 都 包含 有 一 个 域名 ， 几 个 域名 
的 例子 如 下 ; of 


-一 一 


EDU OR MIL GOV COM NET ORG CA DE 
N 
MyUniversityedu YourUnivyersityedu prenhali.com 
Be: PRKERFZN 


EDU: RARA: 
* ORG: FAA EAS 


pO a J 














O 最早 版 本 的 下 只 允许 数字 耻 地 址 ， 但 它 不 很 方便 ， 于 是 符号 名 字 就 出 现 了 。 
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4 MIL; 美国 的 军事 机 构 
GOV: 美国 的 联邦 政府 机 构 ， 例如 NSE (国家 科学 基金 会) 
4 COM: 商业 组 织 
ANET: 互连网 服务 提供 者 
4 国家 代码 ， 例 如 CA (EK), DE (8a), NE (荷兰 ) 等 。 
。 注意 到 美国 的 域名 不 需要 有 国家 代码 ， 这 和 英国 的 邮票 不 需要 印 UK 的 原因 是 一 样 | 
的 ; 这 是 自 地 们 首创 的 。 ROSA, 由 于 我 们 所 知道 的 nemet 是 从 美国 发 展 起 来 的 ， 
这 样 所 有 美国 的 域名 就 不 雷 指 定 国家 ， 但 所 有 其 他 的 域名 需要 指定 两 个 字母 的 国家 域名 
代码 。 本 地 节点 首先 党 试 进行 名 字 和 解析 ， 加 末 本 地 没有 目的 地 位 置 的 信息 ， 则 消息 就 路 
由 到 该 域 相应 的 名 字 解 折服 务 器 中 。 整个 域名 服务 器 组 织 成 树 形 结构 ， 每 个 域 代表 一 个 
分 支 。 每 个 节 点 代表 一 个 完整 的 域名 ， 且 这 个 特定 符 导 名 对 应 着 特定 的 思 地 址 。 








位 置 解析 涉及 将 全 局 名 字 映 射 到 位 置 。 若 名 字 透 明和 位 置 透 明 都 被 支持 的 话 ， 这 是 一 个 

很 困难 的 任务 。 详 细 说 明 8.1 说 明了 与 位 置 透明 有 关 的 路 由 困难 。 我 们 现在 介绍 当 支 持 上 述 

的 透明 性 时 ， 映 射 名 字 到 位 置 的 各 种 方案 。 位 置 解析 可 以 由 使 用 集中 式 服务 器 的 集中 式 方案 

来 实现 或 由 分 布 式 方案 来 实现 。 同 所 有 的 集中 式 解 决 方案 一 样 ， 在 位 置 解析 中 使 用 集中 式 服 

务 器 将 产生 关键 部 件 和 一 -个 系统 瓶 项 。 分 布 式 解决 方案 涉及 到 所 有 位 置 都 维护 完整 的 位 置 解 

析 表 ， 如 果 分 布 式 系统 非常 大 的 话 那 么 这 种 方法 是 行 不 通 的 。 因 此 任何 大 型 分 布 式 系统 都 需 

要 用 带 有 多 个 位 置 解析 服务 器 的 分 布 式 解决 方案 ， 每 个 服务 器 负责 所 有 名 字 集合 的 特定 子 

集 ， 如 图 8-3 所 示 。 用 一 个 服务 器 位 置 映射 表 来 查询 ， 以 确定 系统 中 哪个 服务 器 负责 哪 组 名 

字 集合 的 解析 。 将 这 些 名 字 分 割 到 各 个 服务 器 中 有 两 种 主要 的 方法 。 第 一 种 方法 是 应 用 某 种 
服务 出 i 1 服务 器 2 服务 器 3 

名 字 A 一 B 

AR 





8-3 ”名字 解析 的 分 布 式 解决 方案 
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散 列 函数 到 名 字 中 ， 这 种 散 列 函数 的 值 表 明 哪 个 服务 器 负责 维护 该 位 置信 息 。 第 二 种 方法 是 
基于 文件 类 型 来 确定 位 置 解析 服务 器 ， 每 种 类 型 的 文件 由 不 同 的 服务 器 来 提供 位 置 解析 服 
务 。 无 论 是 采用 哪 种 方法 ， 当 文件 重 定位 时 ， 负 责 其 名 字 解 析 的 服务 器 信息 集 就 会 更 新 ， 这 
种 信息 集 可 以 用 表 或 树 形 纤 构 的 方式 来 存储 。 详 细 说 明 8.3 提供 了 一 个 位 置 解析 的 算法 例 
子 。 分 布 式 解决 方案 通常 允许 服务 器 复制 ， 即 可 以 有 多 个 服务 器 同时 负责 同一 组 名 字 子 集 的 
解析 ， 与 复制 有 关 的 问题 将 在 下 一 节 讨 论 。 


详细 说 朋 8.3 
分 布 式 位 置 解析 算法 


i a ned 

















location function location „resolut ion (name) 


/1 返 加 文件 的 位 置 
“1 输入 为 文件 多 
i | Hf 一 个 可 能 的 实现 
O4 2 
IF local request (name) S. : 
| RRB AURA, 
THEN returh_locaticn(gelf) O =o o : ae 
i: MRR MERA reh 


ELSE a oe . 
= _addreas_code = distributed addresses(nama); _ 
1 为 要 求 的 文件 名 执行 映射 函数 以 确定 相应 的 地 址 码 
RTARTA EHIME T RM RE AA 








_ address holder = ee _holder (address_code) ; | 
H server location 是 将 代码 转换 到 
/位置 的 表 或 树 ， 如 果 有 多 个 服务 器 维护 
1 该 信息 ， 则 选择 其 中 一 个 服务 器 并 将 该 
Mp Anke ee 


location = 0) = 
request _ for _adaress address holder; name); o oo 
UARA RSPB 
“由 文件 的 实际 位 置 
return _location (location); i 


“WW 返 回 文 件 的 地 址 
WELSE 结束 , 非 本 地 ， 








o U&A location-resolution 结束 








8.2 分 布 式 文件 服务 
分 布 式 文件 服务 负责 在 特定 文件 上 进行 的 操作 。8.2.1 节 讲 述 在 分 布 式 环境 中 文件 存在 
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着 多 样 性 ，8.2.2 节 讨 论 与 文件 共享 有 关 的 问题 ，8.2.3 节 介绍 实现 文件 服务 的 方法 ， 在 
8.2.4 节 中 对 文件 服务 主题 进行 总 结 并 讨论 与 文件 复制 有 关 的 问题 。 


8.2.1 文件 多 样 性 


除了 在 8.1 节 中 讨论 过 的 文件 类 型 外 ， 文 件 可 以 在 存储 方式 、 指 派 的 各 种 属性 、 由 底层 
操作 系统 使 用 的 保护 模式 等 方面 发 生变 化 。 


文件 存储 
操作 系统 可 以 用 各 种 方式 来 存储 文件 。 一 些 系 统 以 连续 的 字 节 流 来 存放 文件 ， 这 使 得 在 
文件 中 没有 内 在 的 结构 。 这 种 方法 用 于 结构 化 文件 非 结构 化 文件 


大 多 数 现代 的 操作 系统 ， 这 种 系统 支持 
非 结 构 化 的 文件 。 相 反 ， 结 构 化 文件 
(structured files) 以 如 图 8-4 所 示 的 记录 
结构 来 表示 数据 ， 该 文件 系统 可 以 或 不 
可 以 为 文件 中 的 单条 记录 提供 索引 。 如 
果 支 持 索引 ， 则 单个 的 记录 可 以 显 式 地 
通过 索引 来 访问 。 记 录 索 引 通 常 存放 在 
如 B- 树 或 散 列表 这 样 的 数据 结构 上 。 
若 不 支持 索引 ， 则 单条 记录 就 只 有 通过 
指定 记录 在 文件 中 的 具体 位 置 才能 进行 
187 | 访问 。 

此 外 ， 文 件 可 以 以 二 进 制 方式 或 ASCII 码 方式 来 存储 ， 一 般 两 种 方式 都 允许 使 用 。 二 进 
制 文件 可 以 是 可 执行 文件 或 加 密 文 件 〈 见 第 11 章 的 信息 加 密 )，ASCII 码 文件 包括 各 种 用 户 
可 读 的 数据 及 源 文件 。 对 这 两 种 文件 类 型 的 区 分 ， 在 字 长 度 不 能 被 8 位 整除 的 系统 中 非常 普 
遍 ， 如 一 个 36 位 的 系统 PDP 10。 

文件 属性 

文件 常常 有 一 组 属性 ， 提 供 关于 特定 文件 的 额外 信息 。 不 同 的 文件 系统 为 不 同 的 文件 属 
性 提供 支持 ， 分 布 式 文件 系统 必须 意识 到 并 处 理 各 种 类 型 的 属性 。 一 些 系统 只 允许 特定 的 属 
性 子 集 而 另 一 些 系统 则 允许 有 灵活 性 。 以 下 是 一 组 常见 的 文件 属性 ; 

4 文件 名 (包括 文件 类 型 扩展 名 )。 

4 文件 大 小 。 

4 文件 所 有 权 类 型 (个 人 或 群体 ) 。 

4 文件 所 有 人 和 名字。 

4 文件 创建 的 日 期 。 

4 最 后 一 次 文件 访问 的 日 期 。 

4 最 后 一 次 修改 文件 的 日 期 。 

4 版 本 号 。 

4 相关 的 保护 信息 ( 见 下 文 )。 
目录 服务 (在 8.3 节 讨 论 ) 维护 这 些 属 性 信息 并 将 它们 绑 定 到 特定 文件 上 。 

文件 保护 模式 





图 8-4 结构 化 与 非 结 构 化 文件 
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分 布 式 文件 系统 必须 意识 到 集中 式 系统 中 所 使 用 的 文件 保护 模式 。 集 中 式 文件 保护 模式 
是 基于 文件 允许 访问 的 类 型 、 保 护 所 定义 的 粒度 级 别 ， 以 及 文件 保护 所 使 用 的 类 型 来 实现 
的 。 一 个 文件 可 以 通过 以 下 方式 来 访问 : 

4 文件 读 操作 。 

9 文件 写 操 作 。 

4 文件 截断 操作 。 

4 文件 追加 操作 。 

4 执行 文件 。 

保护 粒度 可 以 通过 单个 用 户 、 能 具体 列 出 来 的 用 户 子 集 、 一 组 用 户 、 特 定 组 织 的 所 有 用 
户 或 世界 上 的 所 有 用 户 等 内 容 来 衡量 。 

对 于 集中 式 系统 ， 有 两 种 主要 的 文件 保护 类 型 ， 访问 列 表 (access list) ， 也 称 为 访问 控 
制 列 表 (ACL) 和 权能 〈capability)。 举 一 个 例子 来 描述 这 两 种 保护 类 型 的 区 别 。 设 想 自 己 是 
上 层 社 会 的 一 员 ， 被 邀请 参加 一 个 晚会 。 主 办 者 可 以 利用 两 种 方法 来 保证 只 有 邀请 的 客人 参 
加 晚会 。 第 一 种 方法 是 将 邀请 的 客人 清单 给 保安 ， 当 人 们 到 达 晚 会 地 点 时 保安 将 他 们 的 名 字 
与 客人 清单 上 的 名 字 核 对 以 检查 名 字 是 否 在 清单 上 。 如 果 他 们 的 名 字 在 上 面 ， 则 就 允许 他 们 
进入 。 第 二 种 方法 是 给 每 位 客人 发 一 份 请 贴 ， 当 被 邀请 者 到 达 时 必须 将 该 请 贴 旺 给 保安 。 客 
人 清单 类 似 于 文件 保护 中 的 访问 列表 方法 ， 该 方法 中 每 个 文件 维护 着 一 个 说 明 哪 个 用 户 被 允 
许 以 何 种 方式 访问 的 列表 。 访 问 列表 由 系统 来 维护 。 当 用 户 要 访问 一 个 文件 时 ， 如 果 用 户 和 
操作 作为 可 接受 的 动作 出 现在 访问 列表 上 ， 则 就 许可 该 操作 。 同 样 地 ， 权 能 同 请 贴 类 似 ， 为 
了 访问 一 个 文件 用 户 必 须 提 供 一 个 权能 ， 表 明 允 许 他 执行 请 求 的 操作 。 

这 两 种 方法 同 它们 的 对 比 物 一 样 有 相似 的 缺点 。 与 晚会 的 主办 者 撤消 一 个 请 贴 时 所 遇 到 
的 困难 相同 ， 文 件 系统 不 能 快速 或 
容易 地 撤消 一 个 权能 。 晚 会 的 客人 
列表 可 能 很 大 ， 同 样 访问 列表 也 非 文件 l 
常 大 。 它 可 以 用 一 个 二 维 数组 〈 列 
表示 文件 名 ， 行 表示 用 户 名 ， 无 论 
他 是 否 为 个 人 或 集体 用 户 ， 入 口 栏 文件 3 
表示 被 授予 的 访问 权限 ) 或 实际 的 

















列表 来 存 伴 。 当 访问 列表 存放 在 一 文件 4 

个 二 维 数组 上 时 ， 就 称 为 访问 矩阵， R= irta =% E = 执行 访问 
如 图 8-5 所 示 。 图 8-6 描述 了 图 8-5 

中 文件 1 的 访问 列表 。 权 能 和 访问 图 8-5 访问 矩阵 


列表 也 可 以 用 来 保护 和 规定 对 任何 系统 资源 的 访问 。 

访问 控制 也 可 以 使 用 权能 和 访问 列表 的 组 合 。 作 为 一 个 例子 ， 让 我 们 参看 1996 年 的 奥 
运 会 上 使 用 的 安全 证 件 。 在 安全 敏感 度 低 的 区 域 ， 只 要 出 示 安 全 徽章 (依据 地 点 和 徽章 的 类 
型 ) 就 可 以 允许 使 用 需要 的 资源 ， 例 如 在 公共 的 通路 上 骑 车 。 相 反 ， 对 于 安全 敏感 度 高 的 区 
域 ， 例 如 奥林匹克 中 心 或 计算 机 中 心 ， 就 要 仔细 检查 徽章 ， 并 且 立 即将 确切 的 身份 号 码 同 访 
问 列 表 进 行 核查 。 如 果 没 有 出 示 权 能 一 一 徽章 ， 就 不 核查 访问 列表 。 关 于 分 布 式 访问 控制 的 
额外 安全 措施 将 在 第 11 HT. 
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文件 1 的 
访问 鹿 表 


E- 执行 访问 


R- EDH We FH 


图 8-6 文件 1 的 访问 列表 


8.2.2 文件 修改 通知 


我 们 已 经 学 过 ， 基 本 的 文件 操作 包括 读 、 写 和 
执行 文件 。 当 多 个 节点 访问 共享 文件 ， 对 于 通知 其 他 
参与 者 有 关 文 件 修改 的 方法 时 每 个 参与 者 必须 取得 一 
致 ， 这 也 通常 称 为 文件 访问 语义 (file access seman- 
tic) 。 有 两 组 通知 方法 ， 第 一 组 是 将 所 有 文件 看 作 不 
可 更 改 的 (immutable) ( 即 不 允许 修改 )， 由 于 不 允许 
修改 ， 就 不 会 出 现 对 数据 的 破坏 ， 这 样 就 不 需要 通 
知 。 第 二 组 通知 方法 是 用 于 可 修改 的 文件 ， 以 下 是 三 
种 基本 的 用 于 可 修改 文件 的 修改 通知 的 方法 ， 又 如 图 
8-7 ARAB: 

1. 立即 通知 : 使 用 立即 通知 的 方法 ， 对 文件 的 
每 次 修改 立即 对 拥有 该 文件 拷贝 的 所 有 参与 者 可 见 。 
在 分 布 式 系统 中 这 种 方法 实现 起 来 是 非常 困难 的 和 不 
切实 际 的 。 

2. 在 关闭 时 通知 : 使 用 在 关闭 时 通知 的 方法 ， 
只 有 对 将 文件 进行 修改 的 参与 者 关闭 文件 ， 也 就 是 终 
止 对 文件 的 访问 时 ， 其 他 参与 者 才 被 通知 已 收 改 文 
件 ， 分 布 式 系统 中 的 其 他 成 员 没 有 更 新 它们 的 拷贝 而 
是 继续 使 用 脏 的 拷贝 。 文 件 的 最 终 内 容 由 最 后 一 个 对 
文件 修改 的 参与 者 来 决定 。 

3. 在 事务 完成 时 通知 ; 一 个 事务 是 一 组 固定 的 
操作 , 当 这 组 固定 的 操作 完成 时 ， 通 知 系统 中 的 成 











道 知 所 有 
参与 者 
通知 所 有 
参与 者 


通知 所 有 
BUH 


C. 事务 完成 时 通知 


BSH 
读 操 作 

对 文件 进行 所 操作 
对 文件 进行 写 操作 
事务 结束 
关闭 文件 


通知 所 有 
参与 者 





图 8-7 修改 通知 的 方法 


员 。 事 务 的 方法 在 分 布 式 芭 统 中 应 用 得 非常 成 功 ， 有 关 该 主题 的 讨论 见 第 9 章 。 


8.2.3 文件 服务 实现 


文件 服务 实现 可 以 是 基于 远程 访问 或 远程 拷贝 的 ， 也 可 以 是 有 状态 或 无 状态 的 。 当 使 用 
远程 访问 时 ， 远 程 的 客户 机 必须 通过 网 络 通信 来 远程 地 执行 读 、 写 、 打 开 、 关 闭 、 追 加 、 截 
断 和 处 理 每 个 它 所 希望 的 操作 。 客 户 方 不 需要 文件 的 任何 存储 空间 ， 但 是 必须 处 理 不 间断 的 
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大 量 的。 相反 ， 如 果 文件 服务 利用 远程 拷贝 来 实现 ， 客 户 机 接收 被 请 求 文件 的 一 个 完整 拷 
贝 。 这 种 实现 也 称 为 全 文件 缓存 (whole file caching)。 使 用 远程 拷贝 的 实现 一 般 只 支持 读 和 
写 操作 并 要 求 客户 方 有 足够 的 存储 空间 来 存放 文件 。 遇 到 的 惟一 的 网 络 延迟 是 在 开始 和 结束 
时 的 文件 传输 。 这 种 方法 比较 简单 ， 并 且 当 整个 文件 将 被 客户 方 用 来 读 或 修改 操作 时 非常 成 
功 。 一 般 来 说 ， 文 件 修 改 通知 所 使 用 的 方式 是 文件 关闭 时 通知 。 应 当 注 意 到 ， 如 果 客 户 方 只 
需要 以 块 来 衡量 的 文件 的 一 小 部 分 ， 就 会 浪费 掉 网 络 资源 和 时 间 。 以 文件 块 为 单位 来 传输 的 
实现 称 为 块 高 速 缓存 (block caching)。 如 果 远 程 拷 贝 允 许 对 文件 车 于 部 分 进行 访问 ， 例 如 块 
高 速 缓存 ， 那 么 服务 器 和 整个 文件 系统 负责 管理 的 单元 数目 将 大 大 地 增加 。 

有 状态 的 服务 器 需要 维护 访问 该 服务 器 文件 的 所 有 客户 机 的 信息 。 具 体 地 说 ， 服 务 器 维 
护 有 关 客 户 方 使 用 的 是 哪个 文件 ， 以 及 对 该 文件 执行 过 哪些 操作 的 信息 。 如 果菜 客户 机 正在 
读 一 个 文件 ， 有 状态 的 服务 器 将 保存 客户 机 访问 的 文件 的 当前 位 置信 息 。 这 将 极 大 地 提高 从 
开始 与 服务 器 连接 传输 信息 之 后 的 所 有 信息 传输 操作 的 效率 ， 但 同时 也 会 增加 客户 方 就 某 特 
定 文件 访问 对 该 服务 器 的 依赖 ， 因 此 这 种 系统 不 能 支持 故障 透明 。 相 反 ， 一 个 无 状态 的 服务 
器 不 维护 客户 方 的 任何 信息 。 客 户 方 的 任何 请 求 都 必须 包含 特定 的 请 求 信息 ， 如 文件 名 、 操 
作 、 在 文件 中 的 确切 操作 位 置 。 客 户 方 自己 维护 状态 信息 ， 虽 然 这 种 方法 增加 了 每 个 操作 的 
开销 ， 但 是 它 提供 了 支持 故障 透明 的 能 力 。 


8.2.4 文件 复制 


当 分 布 式 文件 系统 支持 文件 复制 时 ， 文 件 服务 的 可 靠 性 和 效率 将 会 极 大 地 增强 。 效 率 的 
提高 体现 在 响应 时 间 、 服 务 器 负荷 ， 
以 及 网 络 传输 等 指标 上 。 此 外 如 果 畏 助 服务 器 A 客户 机 上 
一 个 服务 器 月 演 了 ， 文 件 服务 仍然 a 
能 履行 它 的 义务 。 只 有 在 所 有 包含 
特定 文件 拷贝 的 服务 器 都 失效 时 ， 
该 文件 的 服务 才 会 停止 。 这 样 文件 
复制 提供 了 故障 透明 性 ， 因 为 它 允 
许 用 户 继续 工作 而 无 需 知道 菜系 统 
RRM. RM SER ADEE 
显 式 找 贝 ， 即 用 户 发 出 一 个 远程 找 
贝 命令 ， 接 着 它 就 接收 到 文件 的 找 
贝 。 这 种 方法 为 使 用 如 rep (远程 
UNIX # Ul) 和 ftp (与 TCP/IP 有 
关 的 文件 传输 协议 ) 命令 的 早期 网 
络 所 使 用 。 显 式 的 文件 复制 方法 对 
于 一 个 网 络 操 作 系 统 来 说 可 能 已 经 
是 够 了 ,但 它 与 分 布 式 操作 系统 努 
力 提 供 统一 视图 的 目标 有 溢 直 接 的 
冲突 。 分 布 式 操作 系统 中 成 功 的 文 图 8-8 使 用 中 间 文 件 句柄 的 映射 表 
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件 复制 必须 提供 复制 透明 。 文 件 系 统 的 用 户 应 当 意识 不 到 在 系统 中 存在 多 个 文件 斤 贝 ， 而 且 
任何 文件 复制 方法 都 必须 提供 某 种 形式 的 数据 一 致 性 ( 见 第 9 章 )。 

分 布 式 系统 中 的 文件 复制 方案 可 以 是 集中 式 的 或 分 布 式 的 。 集 中 式 的 方案 涉及 到 指定 一 
个 文件 服务 器 为 一 组 文件 的 主 服务 器 ， 所 有 数据 更 新 的 请 求 由 这 个 主 服 务 器 来 处 理 。 当 主 服 
务 器 失效 时 ， 文 件 更 新 将 不 能 进行 ， 但 通过 辅助 服务 器 仍然 可 对 文件 进行 读 操 作 。 主 服务 器 
可 以 给 客户 方 提供 辅助 服务 器 上 拷贝 文件 的 ~-- 个 直接 的 文件 句柄 (file hande), 或 提供 给 所 
有 的 客户 方 一 个 中 间 的 文件 句柄 。 如 果 提 供 中 间 文 件 名 柄 ， 则 主 服务 器 必须 维护 一 个 中 间 文 
件 甸 柄 映射 到 实际 文件 句柄 的 表 ， 如 图 8-8 所 示 。 文 件 句柄 一 般 包 括 文件 的 位 置 和 访问 该 文 
件 的 必要 权限 。 此 外 为 了 帮助 实现 正确 的 文件 更 新 ， 文 件 句柄 可 以 将 序列 号 结合 进来 ， 与 序 
列 号 有 关 的 问题 将 在 第 10 章 中 讨论 。 


对 于 文件 复制 有 两 种 流行 的 


分 布 式 解 决 方案 。 第 一 种 方案 是 far EF 
改 为 “ foo” ETA 


利用 组 通信 。 当 一 个 参与 者 无 论 
什么 时 候 改 变 文件 的 内 容 时 ， 它 
将 写 命令 发 送 给 所 有 的 参与 者 ， 
如 图 8-9 所 示 。 这 种 通信 可 以 立 
即 进行 ， 使 进行 写 操作 的 操作 者 
产生 一 个 短暂 的 中 断 ， 或 由 一 个 
低 优 先 级 的 后 台 进 程 来 完成 。 同 
样 地 ， 接 收 者 可 以 立即 更 新 它们 
的 文件 拷贝 ， 也 可 以 基于 “需要 
时 去 更 新 ”的 原则 更 新 它们 的 拷 
N. 在 以 前 的 改变 命令 被 处 理 之 
前 文件 可 能 又 一 次 被 改变 〈 本 地 
或 远程 ) 时 ， 立 即 通信 和 立即 更 
新 有 助 于 将 这 种 情况 减 到 最 少 。 

第 二 种 分 布 式 的 方法 涉及 到 
投票 和 版 本 号 。 客 户 方 从 各 个 服 A= 对 文件 的 修改 为 foo 


务 器 中 获取 修改 文件 的 权限 。 通 E EA eeo 
$x 一 到 3 | C= 对 文件 的 修改 为 ha | 
过 对 最 新 版 本 号 达成 一 致 的 多 数 一 一 Bee 
服务 器 的 许可 才能 取得 修改 权 B= 对 文件 的 修改 为 so 
限 ， 其 中 规定 这 些 服务 器 没有 发 F- 对 文件 的 修改 为 ho 


送出 更 高 的 版 本 号 。 一 个 放宽 限 ; 
图 8-9 使 用 组 通信 的 分 布 式 文件 复制 
制 的 方案 是 只 要 从 多 数 的 服务 器 


〈 不 需要 对 版 本 号 取得 一 致 ) 中 接收 到 简单 的 许可 ， 并 将 接收 到 的 最 高 的 版 本 号 作为 当前 版 本 号 。 
无 论 采 用 哪 种 方法 ， 写 权限 通常 比 读 权限 需要 更 多 的 票数 ， 当 接收 到 文件 时 版 本 号 就 会 增加 。 


8.3 分 布 式 目 录 服 务 
分 布 式 文件 系统 中 ， 分 布 式 目 录 服 务 负责 全 面 的 文件 组 织 ， 给 用 户 提供 分 布 式 文件 系统 
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的 接口 。 我 们 将 在 8.3.1 ETATER ERAD, REE S8..3.2 节 讨 论 目 录 管 理 ， 最 后 在 
8.3.3 节 讨论 目录 服务 操作 ， 


8.3.1 有 目录 结构 


第 一 种 目录 结构 是 层次 目录 结构 。 这 种 目录 结构 允许 有 目录 和 子 目 录 。 子 目录 只 有 一 个 
父 目录 ， 这 使 得 用 户 可 以 容易 地 组 织 他 们 的 文件 ， 但 使 多 个 用 户 的 文件 共享 变 得 很 困难 。 相 
R, 无 向 图 目录 结构 允许 一 个 目录 可 以 有 和 多 个 父 目录 ， 这 提供 了 方便 的 目录 共享 但 使 得 目录 
管理 复杂 化 ， 特 别 是 使 得 确定 和 删 去 孤儿 文件 更 加 困难 ， 见 8.3.2 节 。 集 中 式 系统 中 一 个 无 
向 图 结构 的 目录 服务 例子 是 UNIX. UNIX 允许 文件 的 硬 链接 〈 在 同一 文件 系统 内 由 系统 管理 
ROE) 和 软 符号 链接 ( 跨 文 件 系统 和 用 户 创建 的 )， 这 样 就 创建 了 多 个 父 和 目录。 在 这 种 环 
境 下 ，UNIX 允许 结 点 可 以 是 另 一 个 结 点 的 父 结 点 或 子 结 点 的 有 向 目录 结构 ， 这 种 结构 可 能 
会 产生 类 似 于 缠绕 的 线 球 的 结构 。 


8.3.2 目录 管理 


目录 管理 与 维护 活动 目录 的 正确 列表 及 它们 下 面 的 文件 有 关 ， 而 且 它 必须 能 够 确定 和 删 
除 未 引用 文件 。 在 一 个 层次 结构 的 目录 系统 中 ， 文 件 只 有 一 个 父 目 录 。 当 父 目 录 被 删除 时 ， 
系统 设 定 或 请 求 所 有 的 子 目 录 和 它们 下 面 的 文件 也 同时 被 删除 。 这 种 文件 不 再 被 目录 引用 ， 
它们 的 资源 释放 给 系统 。 相 反 ， 如 果 目 录 结 构 是 无 向 图 ， 则 文件 可 能 有 多 个 父 目 录 ， 这 就 产 
生 了 何 时 认为 文件 未 引用 的 问题 。 这 是 非常 重要 的 ， 因 为 它 表明 了 什么 时 候 目 录 服 务 允 许 回 
收 该 文件 的 资源 。 这 个 问题 可 以 通过 给 每 个 文件 一 个 引用 计数 器 来 解决 。 当 链接 添加 到 文件 
中 时 该 文件 的 引用 计数 器 就 增加 ， 相 反 当 链接 从 文件 中 删除 〈 由 于 文件 或 目录 删除 ) 时 引用 
计数 器 就 减少 。 任 何 与 引用 计数 器 的 值 为 0 的 文件 相关 资源 将 被 目录 服务 回收 。 在 UNIX 
中 ， 硬 链接 影响 引用 计数 但 软 符号 链接 不 影响 引用 计数 。 这 样 ， 如 果 文 件 的 拥有 者 决定 删除 
一 个 有 符号 链接 的 文件 ， 则 该 文件 就 会 被 立即 删除 。 与 此 相反 ， 在 有 硬 链接 的 文件 中 删除 文 
件 之 前 ， 必 须 删 除 所 有 与 之 .相关 联 的 硬 链接 。 

目录 管理 也 负责 目录 结构 的 存储 。 目 录 结构 可 以 存放 在 一 个 集中 式 的 位 置 ， 也 可 以 在 整 
个 系统 中 分 布 式 地 存储 。 分 布 式 目录 服务 的 一 个 例子 是 电话 目录 服务 。 如 果 你 希望 查找 一 个 
电话 号 码 ， 则 必须 在 正确 的 目录 下 查找 。 没 有 单个 的 目录 服务 可 以 维护 整个 系统 的 信息 。 因 
为 电话 系统 不 提供 位 置 透明 性 ， 所 以 电话 目录 服务 也 不 提供 位 置 透明 性 。 与 文件 复制 及 分 布 
有 关 的 信息 也 与 目录 复制 及 分 布 有 关 。 具 体 地 说 ,分 布 可 以 基于 某 种 类 型 的 散 列 函 数 或 属 
性 ， 比 如 创建 者 。 


8.3.3 目录 操作 


目录 服务 支持 以 下 所 有 的 目录 操作 或 它 的 一 个 子 集 : 
4 创建 目录 。 

© 删除 目录 。 

$ 重 命名 日 录 。 

4 列 出 目录 内 容 。 

4 管理 目录 的 访问 权限 。 
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4 改变 目录 的 访问 权限 。 

4 在 整个 的 目录 结构 内 移动 目录 。 

4 遍历 整个 目录 结构 。 

任何 未 支持 的 但 可 能 被 底层 的 集中 式 操作 系统 允许 的 目录 服务 应 当 有 某 种 类 型 的 默认 的 
映射 或 等 价 操作 。 此 外 目录 服务 器 还 负责 以 下 的 文件 操作 : 

4 创建 文件 。 

4 删除 文件 。 

4 重 命名 文件 。 

4 移动 文件 。 

4 查找 文件 。 

4 复制 文件 (在 新 目录 下 用 新 的 名 字 )。 

同 目录 操作 一 样 ， 任 和 何 未 支持 的 文件 操作 应 当 有 某 种 类 型 的 默认 映射 或 等 价 操 作 ， 因 为 
它们 可 能 被 底层 的 操作 系统 支持 。 


8.4 网 络 文件 系统 


在 本 节 中 ， 我 们 介绍 SUN 公司 的 网 络 文件 系统 (NFS) 版 本 3。8.4.1 节 介 绍 NFS 的 文 
件 服务 ，8.4.2 节 介 绍 NFS 的 目录 服务 ，8.4.3 节 介 绍 NFS 的 名 字 服 务 。 


8.4.1 NFS 文件 服务 


NFS 文件 服务 是 无 状态 的 文件 服务 ， 并 且 是 基于 如 8.2.3 节 所 述 的 块 高 速 缓存 。NFS 利 
用 使 用 外 部 数据 表示 〈 见 第 2 章 ) 的 RPC 机 制 〈 见 第 3 章 ) 为 该 分 布 式 文件 系统 的 用 户 取得 
透明 的 远程 访问 。 分 布 式 系统 的 成 员 可 以 包括 从 个 人 计算 机 到 高 性 能 并 行 计 算 机 。 文 件 访问 
控制 支持 使 用 Kerberos 鉴别 的 DES 密 钥 加 密 ， 见 第 11 BE, NFS 鼓励 所 有 的 服务 器 都 支持 所 
有 的 文件 属性 及 文件 类 型 ， 文 件 和 名 的 实际 大 小 由 客户 方 和 服务 器 共同 达成 的 协定 来 决定 。 
NFS 版 本 3 扩展 了 版 本 2 以 支持 更 大 的 文件 ， 它 能 支持 64 位 大 小 的 文件 。RPC 和 所 有 的 NFS 
文件 系统 到 本 地 文件 系统 的 转换 工作 由 NFS 中 称 为 虚拟 文件 系统 的 系统 来 处 理 。 这 个 虚拟 
文件 系统 位 于 本 地 文件 系统 的 上 层 ， 并 与 本 地 文件 系统 交互 。 

当 客 户 请 求 访问 一 个 文件 时 ， 整 个 磁盘 已 安装 好 ， 文 件 的 初始 块 传送 给 客户 。 具 体 地 
说 ， 客 户 接收 到 一 个 句柄 ， 它 包括 文件 系统 类 型 和 文件 在 磁盘 中 的 地 址 ， 用 以 检索 磁盘 及 磁 
盘 上 的 文件 内 容 。 这 个 句柄 可 以 持续 使 用 ， 直 到 服务 器 撤消 发 给 该 客户 的 句柄 。 给 予 客户 句 
柄 称 为 安装 ， 安 装 算法 的 概述 见 详细 说 明 8,4。 安 装 可 以 是 显 式 的 ， 这 样 访问 的 允许 可 以 是 
“ 按 需 ”或 是 自动 的 。 自 动 安装 涉及 到 自动 系统 程序 ， 它 在 每 次 系统 启动 时 或 客户 访问 远程 
文件 时 用 来 自动 获取 文件 块 。 在 任何 一 种 情况 下 ， 在 调用 时 为 获取 磁盘 上 的 文件 ， 自 动 检索 
利用 句柄 发 送 消息 给 所 有 的 服务 器 。 可 将 第 一 个 服务 器 的 响应 作为 磁盘 的 来 源 。 这 样 NES 
可 以 用 来 支持 位 置 、 复 制 、 和 故障 透明 性 。 但 是 这 些 特点 不 是 NFS 内 在 的 特性 。 值 得 注意 
的 是 ， 确 定 信息 的 最 新 和 正确 版 本 的 方法 还 没有 实现 或 支持 。 没 有 使 用 某 种 形式 的 锁 ， 将 会 
出 现 竞 争 状态 。 

多 个 文件 找 贝 的 修改 通知 被 后 台 进 程 处 理 。 这 样 通知 不 是 立即 发 出 的 ， 但 修改 通知 的 执 
行 优先 于 文件 关闭 。 文 件 中 被 客户 修改 的 部 分 标记 为 脏 ， 只 有 这 些 脏 块 才 会 被 传送 回 服务 器 。 
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详细 说 明 8.4 


NFS 安装 | 

















以 下 是 NES 安装 所 涉及 到 的 步 允 和 远程 文件 句柄 的 使 用 : 

l. NPFS 安装 由 容 户 来 进行 实例 化 。 这 种 实例 化 必须 包 持 运 程 目录 上 的 信息 ， ATR 
SAHRA MRR, VAASPLARREATHRE HY, 

2. 安装 执行 一 个 NFS 查找 操作 来 定位 维护 着 所 需 磁 盘 持 贝 的 服务 器 。 
3. 将 一 个 RPC 发 送 到 相应 的 服务 器 ， 请 求 所 需 的 磁盘 和 句柄。 
4 运程 服务 器 执行 相应 的 安全 检查 ， 看 客户 对 磁盘 内 容 的 访问 是 否 许可 ， 若 是 则 返 
加 一 个 多 栖 络 客户 。 | 

5, 客户 接收 加 文件 句 痪 。 客户 系统 将 表明 文件 是 远程 文件 的 有 关 文件 句 机 信息 记录 
到 本 地 的 文件 系统 表 上 《用 同一 张 表 来 存放 本 过 文 件 的 信息 )。 

6. 接着 就 用 该 表 来 访问 文件 。 如 果 将 要 访问 的 文件 标记 为 远程 文件 ， MAAFA 
息 初始 化 一 个 RPC 的 NFS 文件 请 求 。 如 果 文 件 是 本 地 的 ， 那么 底层 操作 系统 处 理 请 求 。 














8.4.2 NFS 目录 服务 


NFS 假定 层次 结构 的 目录 系统 ， 但 同时 也 支持 创建 UNK 中 常见 的 软 链 接 。 如 8.4.1 节 
所 述 ， 整 个 目录 和 子 目 录 也 可 以 传送 给 客户 ， 这 也 称 为 安装 。NFS 支持 的 目录 操作 列表 见 详 
细 说 明 8.5。 198 


NFS 目录 操作 














TR 
4 Lookup: ESL G ES By 2 











4 Write: AEA Aa ARAYA RAMADAN) 
+ Create al 建文 件 


Remove 删除 文件 。 ; 
+ Rename: EOS RMR ER. 
+ Rmdir; MERR 
4 Mkdir; 创建 目 x. 

-+ Minod: 创建 特殊 文件 o D 
4 Readdir: 读 目录 ， 包含 有 安全 验证 的 条 款 。 
+ Readdirplus: HAR RR Be 。 

4 Fsinfo: 提供 文件 系统 的 信息 ( 
4 Poatat; 提供 文件 系统 的 
4 Coinmit， 强 这 文件 的 
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节点 1 


8.4.3 NFS 名 字 服 务 


NFS 的 名 字 服 务 是 基于 8.4.1 
节 中 所 述 的 文件 或 且 录 的 安装 。 
NES 不 支持 (不 能 轻易 地 使 其 支 
持 ) 一 个 全 局 的 名 字 空 间 ， 客 户 
可 以 通过 显 式 的 安装 文件 请 求 共 
享 远程 的 名 字 空 间 。 当 文件 或 目 
录 安 装 后 ， 它 就 作为 本 地 目录 结 
构 的 一 部 分 呈现 给 客户 。 图 8-10 节点 2 
描述 了 一 个 名 字 为 “foo” 的 文件 
安装 在 两 个 不 同 的 节点 上 。 安 装 
的 文件 或 目录 的 信息 在 本 地 可 得 
到 ， 这 样 就 提供 了 位 置 透明 性 。 
但 是 由 于 这 种 实现 ， 使 得 NFS 系 
统 中 每 个 用 户 有 惟一 的 全 局 文件 
系统 视图 。 并 且 文 件 在 系统 中 可 
以 有 儿 个 “绝对 的 ”名 字 ， 这 为 
使 用 基于 NFS 的 文件 系统 的 分 
布 式 应 用 带 来 了 麻烦 ， 因 为 一 个 图 8-10 NFS 的 名 字 空 间 和 安装 
文件 会 有 几 个 依赖 于 位 置 的 文 

199} FZ. 


8.5 X.500 


在 本 节 中 ， 我 们 对 X.500 目录 服务 作 一 个 简要 介绍 。X.500 也 是 Windows 2000 中 使 用 的 
轻 量 级 目录 访问 协议 (Lightweight Directory Access Protocol, LDAP) 的 基础 ， 见 第 12 章 的 实例 
研究 。X.500 目录 服务 是 由 现在 称 为 ITU -T (国际 电信 联盟 电信 标准 化 部 门 ) 的 CCITT ( 国 
际 电 报 电话 咨询 委员 会 ) 和 国际 标准 化 组 织 (ISO) 定义 的 国际 标准 。 该 目录 服务 的 设计 是 
用 来 提供 与 Intemet 的 类 似 的 电话 公司 黄页 服务 及 邮件 和 电子 邮件 地 址 查找 服务 。X.500 的 技 

术 报 告 RFC 309 中 说 明 的 XX.500 目录 服务 的 目标 如 下 ; 

4 非 集中 式 维护 ， 每 个 节点 只 负责 维护 本 地 那 部 分 的 目录 服务 ， 这 样 存储 的 信息 除 本 地 

外 均 认 为 是 不 可 修改 的 。 

4 支持 功能 强大 的 、 复 杂 的 查询 。 

4 提供 惟一 的 全 局 名 字 空 间 。 

4 提供 允许 本 地 扩展 的 结构 化 的 信息 框架 。 

4 设计 基于 标准 的 目录 服务 ， 这 样 所 有 的 应 用 能 依靠 统一 的 接口 来 使 用 目录 服务 。 

我 们 现在 介绍 X.500 的 文件 和 名 字 服 务 (8.5.1 节 ) 和 目录 服务 (8.5.2 7). 





foo 的 本 地 名 = / usr / students / steven / foo 





foo 的 本 地 名 =/usr/faculty/galli/examples/foo 
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8.5.1 X.500 文件 和 名 字 服 务 ; 信息 模型 


X.500 的 文件 和 名 字 服 务 是 以 信息 模型 来 定义 的 ， 信 息 模 型 负责 信息 的 存储 和 安排 。 设 
计 该 规范 不 是 用 来 实现 通用 的 分 布 式 文件 系统 的 。X.500 信息 模型 将 它 的 基本 结构 看 作 是 一 
个 条 目 ， 每 个 条 目 拥 有 它 所 忆 表 的 对 象 的 信息 。 每 个 对 象 有 一 组 必 备 属性 和 一 组 可 选 属性 ， 
必 备 属性 总 是 由 对 象 继承 得 测 。 如 果 一 个 条 目 代表 一 个 人 ， 则 它 可 能 有 以 下 一 组 属性 ; 

tZ. 

* 姓 。 

4 邮件 地 址 。 

© 电子 邮件 地 址 。 

4 工作 地 点 。 

4 电话 号 码 。 

4 传真 号 码 。 

此 外 每 个 属性 还 有 相关 的 语法 ， 用 来 说 明 属 性 所 使 用 的 数据 类 型 ， 如 文本 或 图 像 。 我 们 
以 电话 号 码 来 说 明 属性 语法 ， 电 话 号 码 只 许 由 数字 、 括 号 及 破 折 号 组 成 。 

X.500 全 局 名 字 空 间 由 有 着 严格 层次 性 结构 的 目录 信息 树 (DIT) 来 表示 ， 名 字 空 间 中 
所 有 的 名 字 及 相关 的 数据 存放 在 目录 信息 库 (DIB) 中 。DIB 的 每 个 条 目 占据 DIT 中 的 一 个 
惟一 的 位 置 ， 如 果 条 目 没 有 子 条 目 则 它 就 称 为 叶 条 目 。 每 个 DIT 条 目 和 它 的 属性 构成 了 该 条 Po 
目的 相对 特异 名 (relative distinguished name，RDN)。 条 目 完整 的 特异 名 由 它 自 己 的 RDN 及 一 
BAS DIT 的 根 条 目 路 径 中 所 有 祖先 级 RDN 组 成 。 这 种 方法 降低 了 重复 名 字 的 出 现 概率 。 
例如 ， 一 个 电话 本 上 可 能 有 几 个 S. Smith, WR S. Smith 的 电话 本 条 目 包 含有 回 朔 1000 年 的 
母系 婚前 姓氏 ， 则 条 目 将 会 是 惟一 的 〈 假 定 你 能 以 这 种 方式 来 识别 出 你 朋友 的 名 字 !)。 这 样 
通过 将 继承 包含 到 特异 名 中 的 方式 ， 每 个 条 目 将 有 全 局 惟一 的 名 字 。 


8.5.2 X.500 的 目录 服务 : 目录 模型 


X.500 的 目录 服务 是 以 目录 模型 来 定义 的 ， 该 目录 模型 假设 查询 操作 比 更 新 操作 多 很 
多 。 目 录 模 型 包含 的 两 个 组 件 分 别 是 目录 用 户 代 理 (DUA) 和 目录 系统 代理 (DSA), AP 
代理 代表 用 户 来 访问 系统 ， 而 系统 代理 维护 目录 信息 库 (DB) 的 某 一 部 分 且 能 为 用 户 代理 
提供 目录 访问 点 。 整 个 DIB 由 多 个 DSA 进行 维护 。 为 了 支持 位 置 透明 和 复制 透明 ，DSA 使 
用 两 种 分 别称 为 链接 和 参照 的 技术 。DIB 的 一 个 特定 部 分 由 一 个 称 为 主 DSA 的 主 节点 来 维 
护 ， 存 放 这 同一 部 分 DIB 的 节点 由 主 DSA 的 影子 DSA 来 维护 。 影 子 DSA 自己 也 可 以 有 影子 
DSA, 但 只 有 主 DSA 才能 修改 DB 的 内 容 。 所 有 报告 给 影子 DSA 的 修改 必须 传送 给 该 部 分 
DIB 的 主 DSA。 


8.6 小 结 


分 布 式 文件 系统 有 三 个 主要 的 任务 。 第 一 ， 它 必须 提供 命名 文件 的 方法 及 通过 名 字 服 务 
来 管理 文件 名 的 方法 ， 这 可 以 用 支持 名 字 透 明 的 方式 来 实现 。 全 局 命名 方案 的 选择 也 影响 束 
个 文件 系统 是 否 支 持 位 置 透 明 。 第 二 ， 文 件 系统 必须 管理 文件 ， 包 括 它们 的 各 种 属性 及 正确 
的 授权 访问 ， 这 可 以 通过 文件 服务 来 实现 。 这 种 服务 也 负责 确定 文件 是 否 能 被 修改 。 如 果 
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能 ,文件 服务 必须 确定 怎样 实现 对 文件 的 修改 。 同 时 它 必 须 决 定 当 文件 被 客户 使 用 时 文件 是 
仍然 在 服务 器 上 ， 还 是 客户 将 在 本 地 拥有 文件 的 拷贝 。 如 果 人 允许 文件 复制 ， 那 么 提供 复制 透 
明 也 是 文件 服务 的 责任 。 最 后 ， 分 布 式 文件 系统 包括 目录 服务 ， 目 录 服 务必 须 提 供 一 个 用 户 
接口 和 文件 的 整体 结构 。 在 分 布 式 系统 中 必须 包括 这 三 种 服务 的 每 一 种 ， 但 这 些 服务 可 以 作 
为 单独 的 单元 或 组 合成 一 个 或 两 个 不 同 的 服务 来 实现 。 如 果 目 录 服 务 是 为 了 实现 分 布 式 操作 
系统 的 目标 ， 那 么 它 必 须 支持 所 有 相关 的 透明 性 。 

在 本 章 中 ,我 们 也 介绍 了 两 个 分 布 式 文件 系统 的 实例 。 这 两 个 实例 有 着 完全 不 同 的 实现 
方法 ,每 种 方法 都 是 突破 性 的 实现 。NFS 提供 了 文件 系统 的 全 面 的 服务 ， 而 X.500 主要 是 提 
供 目 录 服 务 。NFS 提供 了 全 局 命名 ， 但 同一 文件 在 不 同位 置 名 字 就 不 同 ， 而 X.500 提供 了 一 
种 全 局 惟一 名 字 的 命名 方案 。NFS 本 身 不 支持 复制 ， 而 X.500 利用 了 全 局 不 可 修改 数据 的 特 
性 实现 了 全 面 的 复制 支持 。 

为 了 保证 可 以 接受 文件 内 信息 修改 的 行为 ， 分 布 式 文件 系统 或 者 利用 分 布 式 文件 系统 的 
应 用 也 必须 解决 以 下 问题 。 具 体 地 说 ， 它 们 必须 提供 并 发 控制 (第 5 章 )， 确 定 一 个 合适 的 
一 致 性 模型 (第 9 章 )， 以 及 利用 某 种 形式 的 序列 号 (第 10 章 )。 关 于 分 布 式 文件 系统 的 研 
究 还 在 进行 当中 。 当 前 ， 轻 量 级 目录 访问 协议 (LDAP) 极 有 可 能 成 为 UNIX 和 基于 Windows 
系统 的 统一 的 解决 方案 。 无 论 是 什么 方案 ， 必 须 解 决 文件 的 透明 访问 问题 。 随 着 可 用 信息 数 
量 和 需要 支持 的 文件 类 型 (特别 是 多 媒体 ) 的 不 断 增加 ， 提 供 对 世界 范围 内 信息 的 安全 及 高 
效 访问 是 对 广大 研究 人 员 提 出 的 挑战 。 


8.7 参考 文献 


第 1 章 中 给 出 的 参考 文献 能 提供 一 些 分 布 式 文件 系统 的 总 体 的 信息 ， 涉 及 到 本 章 内 容 的 
一 些 传统 的 研究 论文 包括 [BKT85, CAKIMS92, CBE95, DaBu85, Dio80, Fr0185, GNS88, 
HKMNSSW88, Kum91, LeSi90, LZCZ86, MiDi&g2, MSCHRS86, NWO88, San87, Sat90a, Sat90b, 
ScPu94，SMI80， 和 YSL97] 。 

以 下 提供 一 些 Intenet 上 涉及 到 分 布 式 文件 系统 的 资源 的 链接 ， 对 NFS 作 了 详细 描述 的 
1989 请 求 评注 (request for comments, RFC) 可 以 在 http: //www. cis. ohio-state. edu/htbin/rfe/rf- 
1094. html 找到 ， 涉 及 到 NFS 版 本 3 的 1995 RFC 见 http: //www. cis. chio-state. edu/htbin/rfe/rf- 
c1813.html, 与 NFS 有 关 :的 所 有 REC 的 完整 的 清单 见 http: //www.cis. ohio-state. edu/cgi-bin/ 
wais-rfc. pl.? NFS. NFS 的 另外 的 信息 可 以 在 SUN 公司 的 主页 htp: //www.sun. com 上 查找 到 。 
以 下 是 有 关 CCITT 的 X.500 目录 服务 的 一 些 RFC: 

@ http: //www.cis. ohio-state.edu/htbin/rfe/rfc1308. html (执行 的 介绍 )。 

4 http: //www. cis. ohio-state. edu/htbin/rfe/rfc1309. html (技术 概述 )。 

@ http: //www.cis. ohio-state.edu/htbin/rfe/rfce1275. html (复制 的 要 求 )。 

Ej X.500 有 关 的 RFC 的 完整 清单 可 以 在 以 下 链接 获得 : 

9 http: //www.cis.okio-state.edu/cgi-bin/ wais-rfc.pl.? X.500 (与 X.500 有 关 的 所 有 RFC 的 

完整 清单 )。 

AFS 是 另 一 种 使 用 远程 拷贝 的 流行 的 分 布 式 文件 系统 ，AFS 代表 Andrew 文件 系统 ，An- 
drew 是 该 系统 的 发 源 地 -< 内 基 - 梅 隆 大 学 的 创办 者 。AFS 已 经 商业 化 ， 它 现在 是 Transare 4 
司 的 一 个 产品 。 有 关 ARS 的 概述 见 http: //www.alw.nih.gov/Docs/AFS/AFS_ toc,html。AFS 在 
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Transarc 公司 中 的 主页 在 http: //www. transarc . com/afs/transare . com/public/www/Product/ AFS. 与 
AFS 有 关 的 常见 问题 (FAQ) 及 回答 见 http: //www. transarc. com/afs/transarc.com/ public/www/ 
Product/ AFS/FAQ/faqo 


LDAP 


4 http: 
$ http: 
+ http: 
$ http: 
4 http: 


LDAP 


的 REC 可 以 在 以 下 链接 中 找到 ; 

//www.cis. ohio-state .edu/htbin/rfc/rfc2251. html, 

//www. cis. ohio-state.edu/htbin/rfe/rfe2252. html, 

//www . cis. ohio-state. edu/htbin/rfe/rfc2254. html, 

//www .cis. ohio-state . edu/htbin/rfe/rfe2255. html, 

//www.cis. ohio-state . edu/htbin/rfe/rfc2307 . html, 

的 用 户 手 册 的 在 线 版 本 见 http://www. umich. edu/ ~ dirsvcs/ldap/doc/man/。 此 外 ， 有 


多 个 与 LDAP 文档 进行 链接 的 且 包 含有 FAQ 链接 的 Web 页 地 址 为 http: //www.umich.edu/ ~ 
dirsves/ldap/doc/。 


习题 


8.1 


8.2 


8.3 


8.4 


8.5 


8.6 


8.7 
8.8 


8.9 
8.10 


分 布 式 名 字 服 务 的 主要 功能 是 什么 ? 对 于 集中 式 操作 系统 来 说 名 字 服 务 有 必要 吗 ? 
如 果 没 必要 ， 请 解释 为 什么 。 如 果 有 有 必要， 阐述 分 布 式 名 字 服 务 所 需要 的 额外 特 
性 。 

如 果 支 持 文件 类 型 ， 在 分 布 式 操作 系统 中 当 节点 使 用 不 同 的 底层 操作 系统 时 会 带 
来 什么 问题 ? 请 冰 述 两 种 支持 /处 理 本 地 未 知 类 型 文件 的 方案 。 

请 阐述 与 支持 位 狂 透 明 有 关 的 两 个 优点 和 两 个 缺点 (或 问题 )。 

早期 的 操作 系统 有 时 提供 一 个 平面 的 名 字 空 间 和 平面 的 目录 结构 ， 树 形 结构 是 不 
允许 的 ， 所 有 的 文件 都 在 同一 层 。 在 多 用 户 环境 下 平面 名 字 空 间 和 目录 结构 的 问 
题 是 什么 ? 这 是 分 布 式 环境 下 实用 的 方法 吗 ? 

如 果 要 求 每 个 节点 都 维护 一 个 由 和 名字 映射 到 位 置 的 完整 列表 ， 这 样 的 分 布 式 系统 
有 什么 缺点 ? 

请 阐述 在 分 布 式 文件 系统 中 使 用 复制 的 三 个 优点 。 

哪 种 类 型 的 应 用 会 从 使 用 结构 化 文件 中 受益 ? 请 阐述 支持 结构 化 文件 的 缺点 。 
根据 以 下 撤消 访问 权限 的 可 能 类 型 ， 评 价 权能 和 访问 权限 。 也 就 是 说 ， 该 方法 支 
持 相应 的 撤消 吗 ? 如 果 它 支持 ， 请 说 明 为 什么 支持 。 如 果 它 不 支持 ， 请 阐述 一 个 
使 它 支持 的 解决 方案 。 陈 述 任何 你 所 作 的 假设 。 

A. 立即 撤消 。 

B. 只 对 单个 客户 撤消 权限 。 

C. 对 单个 客户 部 分 地 撤消 权限 (例如 撤消 写 权 限 但 保留 读 权 限 )。 

D. 暂时 撤消 权限 。 

请 阐述 只 支持 不 可 修改 文件 的 分 布 式 文件 系统 的 优 缺点 。 

依据 以 下 项 目 ， 比 较 有 状态 的 和 无 状态 的 文件 服务 器 : 

A. 支持 故障 透明 。 

B. SAW BBA, 

C. 支持 复制 透明 。 
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8.11 


D. 效率 。 

依据 以 下 项 目 ， 比 较 基 于 远程 访问 的 文件 服务 器 和 远程 拷贝 的 文件 服务 器 : 

, 支持 故障 透明 。 

, 支持 位 置 透明 。 

. 支持 复制 透明 。 

. 修改 通知 。 

. 文件 修改 管理 。 

. 对 服务 器 的 要 求 。 

. 对 客户 的 要 求 。 

H. 效率 。 

在 分 布 式 文件 系统 中 ， 使 用 中 间 文 件 句 酉 与 使 用 直接 文件 句柄 相 比 其 优点 是 什 
么 ? 

请 阐述 在 分 布 式 系 统 中 支持 无 向 图 目录 结构 所 面临 的 困难 ， 这 种 结构 对 全 局 命名 
方案 有 什么 影响 ? 又 对 允许 软 链接 有 何 影 响 ? 

NES 支持 位 置 透明 吗 ? 为 什么 ? 请 详细 说 明 你 的 理由 。 

为 什么 NFS 支持 全 局 名 字 空 间 很 困难 ?请 讲述 一 种 让 NFS 能 支持 全 局 名 字 空 间 的 
可 行 方案 。 

请 阐述 X.500 假定 查询 操作 比 更 新 操作 出 现 的 机 会 多 得 多 的 目的 。X.500 能 够 避 
免 什 么 问题 而 NES 却 不 能 避免 ? 

在 分 布 式 文件 系统 中 提供 同 X.500 一 样 的 非 集 中 式 文件 系统 维护 的 优点 是 什么 ? 
人 允许 X.500 的 影子 DSA 自己 有 影子 DSA 的 优点 是 什么 ? 

为 什么 使 用 分 布 式 文件 系统 的 应 用 必须 确保 在 某 一 层次 上 使 用 并 发 控制 机 制 ? 
就 分 布 式 文件 系统 所 支持 的 三 种 服务 来 比较 NFS, X.500 及 AFS (在 8.7 节 有 它 
的 相关 链接 )。 


QO AAO MO we SP 


第 9 章 事务 管理 和 一 致 性 模型 


在 前 几 章 讨论 的 一 些 内 容 中 ， 我 们 经 常 需要 允许 分 布 式 系 统 中 的 多 个 成 员 访 问 和 改变 共 
享 的 数据 。 在 这 一 章 中 ， 我 们 将 集中 探讨 一 些 有 关 确 保 正 常 的 数据 操作 的 问题 。 第 5 章 里 我 
们 学 习 了 几 种 并 发 控制 的 方法 。 在 这 一 章 中 ， 我们 要 集中 探讨 在 分 布 式 系统 中 操作 共享 数据 
最 成 功 的 方法 之 一 : 事务 管理 。 事 务 管理 可 以 同 DSM 或 者 分 布 式 文件 系统 合并 ， 用 一 些 我 
们 学 过 的 并 发 控制 的 机 制 去 实现 。 在 9.1 节 中 我 们 将 要 看 到 一 些 合 并 的 事务 管理 在 分 布 式 系 
统 中 的 例子 。 在 9.2 节 中 我 们 将 给 出 事务 的 定义 及 其 基本 的 ACID 特性 。9.3 节 将 介绍 一 致 
性 的 多 种 形式 ， 它 们 可 能 是 由 事务 管理 系统 和 DSM 提出 的 。9.4 节 将 讨论 一 个 常见 的 实现 事 
务 管理 的 协议 。9.5 节 将 介绍 租 套 事务 的 概念 。 最 后 ，9.6 节 将 讨论 和 实现 事务 管理 系统 相 
关 的 许多 问题 。 


9.1 事务 管理 的 动机 


BH (Transaction) 就 是 对 于 共享 数据 的 一 组 操作 的 集合 ， 这 组 操作 可 以 作为 单个 的 操 
作 。 事 务 管理 就 是 为 确保 正常 的 事务 操作 而 提供 的 服务 。 有 人 可 能 会 想起 竞争 条 件 ， 即 一 个 
函数 的 输出 或 者 一 个 变量 的 值 取决 于 输入 的 时 间 顺 序 。 特 别 地 ， 两 个 输入 可 能 为 了 确保 它们 
的 结果 是 最 新 的 而 造成 竞争 。 事 务 就 是 来 处 理 竞争 条 件 在 分 布 式 环境 下 产生 的 问题 的 。 

有 很 多 事情 都 会 驱动 人 们 ， 并 引起 他 们 的 兴趣 。 一 个 普通 的 方法 是 谈论 钱 ， 可 能 “金钱 
JIRE (Money talks) ”一 词 就 是 由 此 而 来 的 。 这 一 节 就 要 展示 如 果 缺 乏 正 确 的 事务 管理 将 产生 
的 两 个 潜在 问题 ， 更 新 遗失 和 恢复 不 一 致 。 我 们 利用 银行 账户 作为 一 个 例子 ， 如 果 没 有 事务 
管理 ,这 个 例子 中 的 账户 就 是 你 的 ! 


9.1.1 更 新 遗失 


在 这 一 节 中 ， 我 们 介绍 一 个 促进 事务 管理 的 经 典 问题 一 更 新 址 失 。 更 新 遗失 这 一 词汇 
用 在 本 书 内 是 指 不 正确 地 处 理 了 数据 操作 ， 以 致 某 一 动作 的 结果 遗失 了 。 为 了 说 明 更 新 遗失 
问题 ， 我 们 考虑 以 下 两 个 动作 。 

动作 1 

Lynn 有 一 张 “ 现 金 卡 ”可 以 自动 存 取 她 在 银行 的 共享 账户 。 她 在 自动 取款 机 上 要 求 取 
出 $200。 

动作 2 

Steven 也 有 一 张 “现金 卡 ”可 以 自动 存 取 Lymm 的 银行 账户 ， 此 账户 是 他 和 Lyon 共享 的 。 
他 在 自动 到 款 机 上 要 求 取出 $300。 

现在 假设 Steven 和 Lynn 同时 在 不 同 的 自动 取款 机 上 操作 。 现 在 账户 余额 是 $ 2500。 如 果 
自动 取款 机 上 安装 的 程序 在 分 布 式 环境 中 不 能 正确 运行 ， 以 下 场景 之 一 就 可 能 发 生 。 这 个 例 
子 的 伪 码 表述 见 详细 说 明 9.1。 

场景 1 
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两 个 自动 取款 机 都 得 到 账户 余额 为 $ 2500 的 信息 。Lynn 的 动作 先 完 成 。 结 果 ，$ 2300 的 
余额 写 回 账户 。 过 了 一 会 儿 ，Steven 完成 了 他 的 动作 ， 然 后 $2200 的 余额 写 回 账户 ， 如 图 9-1 
所 示 。 而 正确 的 余额 应 为 $ 2000。 


Lynn 共享 的 银行 帐户 Steven 





1. 得 到 余额 
2. Lynn 的 动作 被 记录 
3, Steven 的 动作 被 记 苞 


图 9-1 更 新 遗失 


场景 2 

两 个 自动 取款 机 都 得 到 账户 余额 为 $ 2500。Steven 的 动作 先 完成 。 结 果 ，$ 2200 的 余额 
写 回 账户 。 过 了 一 会 儿 ，Lynn 完成 了 她 的 动作 ， 然 后 $ 2300 的 余额 写 回 账户 。 而 正确 的 余额 
应 为 $2000。 

ay BIE FEAR: “MA, KET! Lynn 和 Steven 赚钱 了 !” 但 是 如 果 他 们 是 去 存款 呢 ， 又 或 
者 你 是 站 在 银行 一 方 的 立场 呢 ? 没有 一 个 场景 是 正确 或 者 说 是 可 以 接受 的 。 在 分 布 式 环境 中 
的 数据 操作 应 该 不 仅 允许 动作 一 起 发 生 ， 还 要 提供 方法 来 保证 正确 的 账户 余额 ， 本 例 中 应 
为 $ 2000。 


9.1.2 检索 的 不 一 致 


当 一 个 数据 值 返回 时 ， 我 们 都 认为 它 是 正确 的 。 尽 管 这 肯定 是 一 个 令 人 期 望 的 属性 ， 但 
是 如 果 没 有 事务 管理 对 数据 的 所 有 拷贝 进行 正确 处 理 ， 它 就 不 一 定 成 立 了 。 以 下 第 一 个 条 件 
或 者 两 个 条 件 都 满足 ， 将 可 能 产生 恢复 不 一 致 的 问题 。 

4 共享 数据 的 修改 操作 不 是 原子 性 的 。 

4 存在 数据 的 多 个 拷贝 。 


详细 说 明 9.1 Ee es 


动作 1 = = 
get. Balano 6i 
He Belance-Balance-200); 
Return Balance : 























动作 ? 

: det Balance: : Eo 
BalancesBaiance- -300; : 

> Return Balance; Bn 


场景 1 : 
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ACTION1: Get Balance; 


Ht SEP BH A $2500 
H IEP a BA $2500 


ACTION2: Get Balance; 


ACTIONI: Balancé-Ralance- 200; 
ACTION2: Balance«<Balance-300; 
ACTIONI: Return Balance; 
ACTION2: Return Balance, 
RESULT: Balancee2200 


场景 2 (BH 9-1) 


ACTIONI: Get Balance; : T a d f 
SINF REAR 
MEP RAAS 、 


ACTION2: GET Balance; 
ACTIONI: Balance=Balance-200; 
ACTION2: Balance=Balance-300; © 
ACTION2: Return: Balance; 
ACTIONI: Return Balance; 
RESULT: BAlance=2300 
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恢复 不 一 致 包含 了 检索 到 的 数据 不 能 反映 最 新 的 事务 操作 情况 。 当 共享 数据 的 修改 操作 
非 原 子 性 时 ， 不 但 更 新 遗失 问题 会 发 生 ， 而 且 恢 复 不 一 致 的 问题 也 会 发 生 。 如 果 数 据 有 多 个 
拷贝 ， 而 且 这 些 拷贝 也 不 是 原子 性 地 更 新 时 ， 这 问题 就 更 容易 发 生 了 。 更 新 遗失 和 恢复 不 一 
致 之 间 主 要 的 一 点 不 同 可 以 用 一 个 词 来 概括 : 时 间 。 在 更 新 遗失 中 ， 两 个 动作 是 在 同时 发 生 
的 。 人 恢复 不 一 致 则 可 以 在 事务 开始 后 的 任何 时 间 发 生 ， 只 要 数据 的 拷贝 没有 在 另 一 个 动作 取 
得 数据 值 之 前 更 新 。 我 们 现在 来 看 看 恢复 不 一 致 问题 上 时 间 因 素 的 一 个 例子 。 我 们 再 一 次 应 
用 9.1.1 节 中 的 动作 工 和 动作 2。 

动作 1 

Lynn 有 一 张 现金 卡 可 以 自动 存 取 她 在 银行 的 共享 账户 。 她 在 自动 取款 机 上 要 求 取 出 $ 
200。 

动作 2 

Steven 也 有 一 张 现金 卡 可 以 自动 存 取 他 与 Lynn 共享 的 银行 账户 。 他 在 自动 取款 机 上 要 求 
取出 $300。 

现在 假设 Lynn 和 Steven 在 不 同 的 自动 取款 机 上 操作 ， 尽 管 其 中 一 个 比 另 一 个 稍稍 晚 了 
一 点 ， 但 两 人 几乎 是 同时 进行 操作 的 。 当 前 账户 的 余额 为 $2500。 假 定 自动 取款 机 上 没有 设 
置 成 能 在 分 布 式 环境 中 正确 操作 ， 那 么 以 下 任 一 场景 就 有 可 能 发 生 。 这 些 例 子 的 伪 码 方式 在 
详细 说 明 9.2 中 给 出 。 

场景 1 

lynn 首先 来 到 自动 取款 机 处 。 她 检索 到 的 余额 为 $ 2500。 从 这 个 余额 中 ， 她 取出 了 
$ 200, 剩 下 的 余额 为 $ 2300。 在 正确 的 余额 传送 到 系统 之 前 ，Steven 来 到 了 自动 取款 机 处 ， 他 
检索 到 了 一 个 不 正确 的 账户 余额 $2500， 这 个 余额 没有 反映 Lynn 的 操作 效果 。Steven 从 这 个 
余额 中 提出 了 $ 300， 记 录 下 的 余额 为 $ 2200。 注 意 ， 虽 然 记 录 了 Lyn 的 动作 ， 但 是 恢复 不 
一 致 导致 了 一 个 对 于 共享 数据 的 不 正确 的 操作 ， 如 图 9-2 所 示 。 

场景 2 

Steven 首先 来 到 自动 取款 机 处 。 他 检索 到 的 余额 为 62500。 从 这 个 余额 中 ， 他 取出 了 $ 300， 
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Lynn Steven 


共享 银行 账户 


} =H 


LLynn 检索 余额 并 取出 $200 

2ajym 事 务 的 结果 开始 向 银行 账户 记录 发 送 
2b.Steven 检索 余额 并 取出 5300[ 恢复 不 一 致 发 生 了 ! ] 
2cJynmn 的 结果 传输 到 银行 记录 

3. Steven 的 结果 传输 到 银行 记录 





9-2 恢复 不 一 致 





0 


` ACTIONI: BalancesBalance- 200; — 
ACTION]: Return Balance; ~ 
"RESULT: Balance=2300 . 
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剩 下 的 余额 为 $2200。 在 正确 的 余额 传送 到 系统 之 前 ，Lynn 来 到 了 自动 取款 机 处 。 她 检索 到 
了 一 个 不 正确 的 账户 余额 $2500， 从 这 个 余额 中 提出 了 $200， 记 录 下 的 余额 为 $ 2300。 注 意 ， 
虽然 记录 了 Steven 的 动作 ， 但 是 恢复 不 一 致 又 一 次 导致 了 一 个 对 于 共享 数据 的 不 正确 的 操作 。 


9.2 事务 的 ACID 特性 


更 新 遗失 和 恢复 不 一 致 的 问题 只 是 在 分 布 式 系统 中 操作 共享 数据 时 可 能 产生 的 问题 中 的 
两 个 例子 而 已 。 另 一 个 间 题 是 在 数据 操作 过 程 中 服务 器 的 骨 演 。 在 所 有 的 场景 中 ， 把 一 组 动 
作 定义 为 一 个 事务 以 及 应 用 事务 管理 将 有 助 于 确保 正确 的 数据 操作 ， 即 便 系统 骨 溃 也 是 如 
此 。 回 想 一 下 ， 事 务 是 一 组 相关 联 的 动作 的 集合 ， 事 务 管理 指 的 是 在 分 布 式 系统 中 对 所 有 事 
务 的 恰当 操作 。Harder 和 Reuter 在 【HaRe83】 中 建议 用 助 记 符 ACID 来 记忆 事务 的 基本 特性 ， 
如 下 所 示 : 

4 原子 性 《Atomicity) ; 事务 必须 保证 它 要 人 么 完整 地 发 生 要 人 么 完全 不 发 生 ， 即 便 存 在 故 

障 ， 事 务 也 应 该 是 完整 的 或 者 索性 没有 。 

4 一 致 性 〈Consistency): 事务 必须 以 一 致 的 状态 开始 ， 并 在 一 致 的 状态 中 离开 系统 。 
9.3 节 将 详细 讨论 一 致 性 的 多 种 形式 。 

4 z žė (Isolation): 除了 要 求 事务 必须 以 完整 的 或 没有 的 方式 发 生 以 外 ， 还 应 要 求 其 
他 的 成 员 一 定 不 能 访问 中 间 的 结果 。 所 有 中 间 的 操作 都 独立 地 执行 ， 外 界 成 员 的 访问 
只 有 在 满足 一 致 性 条 件 时 才能 进行 。 

4 持久 性 (Durability); 一 旦 服务 器 提交 了 一 项 事务 ， 它 就 需要 完成 这 项 事务 ， 即 便 遇 到 
了 系统 故障 ， 同 时 ， 这 些 结果 也 应 成 为 永久 结果 。 

现在 我 们 来 检查 一 下 为 什么 合适 的 事务 不 会 受 更 新 遗失 的 影响 。 首 先 ， 事 务必 须 是 原子 
性 的 。 这 样 ， 分 布 式 系统 中 的 多 个 成 员 就 不 会 在 想 改 变 账户 余额 的 时 候 并 行 地 检索 到 账户 的 
相同 余额 。 其 次 ， 根 据 一 致 性 特性 ， 上 述 场景 都 不 会 发 生 ， 因 为 事务 离开 系统 的 时 候 均 处 于 
不 正确 的 、 而 且 是 不 一 致 的 状态 下 。 第 三 ， 根 据 独 立 性 特性 ， 一 个 动作 不 能 干涉 别 的 动作 。 
在 所 有 的 实际 情况 中 ， 一 个 动作 必须 等 待 其 他 的 动作 完成 。 最 后 ， 根 据 持久 性 特性 ， 动 作 必 
须 是 持续 的 。 相 反 ， 如 果 硅 更 新 遗失 的 例子 中 Lynn 的 动作 先 完 成 ， 则 她 的 动作 不 持久 ， 也 
不 一 致 。 

我 们 现在 检查 一 下 这 些 ACID 特性 能 否 防 止 上 述 Steven 和 Lynn 遇 到 的 恢复 不 一 致 问题 。 
首先 ， 如 果 动 作 是 原子 性 钓 ， 则 读 出 余额 、 改 变 余额 和 写 回 余额 将 作为 一 个 单独 的 动作 出 
现 。 所 以 ， 第 二 个 动作 就 不 能 在 这 个 单独 动作 中 间 发 生 。 这 一 点 也 同时 由 独立 性 要 求 所 保 
证 ; 然而 最 主要 的 特性 还 是 一 致 性 特性 。 在 不 能 保证 动作 原子 性 的 条 件 下 ， 事 务 在 一 个 非 一 
致 的 状态 中 离开 了 系统 。 特 别 地 ， 如 果 系 统 是 在 一 个 一 致 的 状态 下 ， 而 且 也 符合 持久 性 特 
性 ， 恢 复 不 一 致 问题 就 不 会 发 生 。 所 以 ， 如 果 应 用 了 正确 定义 的 事务 概念 ， 只 会 发 生 以 下 的 
两 个 场景 。 在 详细 说 明 9.3 中 给 出 了 事务 的 擅 码 表示 。 

事务 1 

Lynn 有 一 张 能 自动 存 取 她 的 共享 银行 账户 的 现金 卡 ， 她 要 求 取出 $200。 

事务 2 

Steven 也 有 一 张 现金 卡 可 以 自动 存 取 他 的 银行 账户 ， 此 账户 是 和 Lynn 共享 的 。 他 要 求 取 
出 $ 300。 
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场景 
Lynn 的 事务 首先 执行 ， 执 行 的 结果 余额 $ 2300 被 永久 记录 下 来 。Steven 的 事务 随后 执 
行 ， 一 个 新 的 执行 结果 余额 $2000 也 被 永久 记录 下 来 ， 如 图 9-3 所 示 。 


Lynn _ Steven 


共享 的 银行 账户 





Lynn 的 原子 事务 发 生 。 检 索 得 到 S2500 的 余额 ， 取 出 $200, 
然后 永久 记录 新 的 账户 余额 $2300。 

2.Steven 的 原子 事务 发 和 后。 检索 得 到 $2300 的 余额 ， 取 出 $300, 
然后 永久 记录 新 的 账户 余额 $2000。 


图 9-3 正当 的 事务 管理 


场景 2 
Steven 的 事务 首先 执行 ， 执 行 的 结果 余额 $2200 被 永久 记录 下 来 。 现 在 执行 Lynn 的 事 
Z, 一 个 新 的 执行 结果 余额 $2000 被 永久 记录 下 来 。 
214 无 论 是 哪 一 个 场景 ， 应 用 遵循 ACID 特性 要 求 的 事务 保证 了 正确 的 结果 。 








详细 说 明 9. 3 
事务 ay 








Ezi 
Get Balance; : 
BalancesBalance-200; 
Return Palance; 


Get Balance; Con 
: Belancesbalance-300;- 
: Return: Balance; 


Begin 7 TRANSACTION] | - 
TRANBACTION?: Get Balance; o 


o a U JEP ARH $2500 
TRANSACTION : dalanvecbate 0 
TRANSACTION} « Return Balance; 








u w ae 为 $2300 


End TRANSACTION .| 


Begin TRANSACTION? 5 
TRANSACTION? : Get Batanee; o 
u z fem 为 $2300 
i ES 


- TRANSACTION? + eran 3 
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RESULT: Balance=2000 


景 2 
Begin TRANSACTION2 © z 
TRANSACTION2: GET Bal: ance; 
IEP RIA $2500 - 
TRANSACTION? : Balance -Bal ance- 300; 
TRANSACTION2: Return Balanca; _ : 


End TRANSACTION2 a ee ae 为 $2200 
Begin TRANSACTION1 
TRANSACTIONI: Get Balance; 


/账户 tu» $2200 
TRANSACTION : Balance sBalance- 200; ; 

TRANSACTION]: Return Balance; ~~ : 
‘End TRANSACTION} : 


RESULT; Balance-2000 
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9.3 一 致 性 模型 


我 们 已 经 学 过 ， 一 致 性 是 事务 要 求 的 一 个 特性 。 在 第 4 章 中 我 们 讨论 共享 数据 操作 的 多 
种 形式 时 曾经 遇 到 过 这 个 术语 。 这 一 节 中 ， 我 们 要 检查 一 致 性 模型 的 多 种 形式 。 每 种 一 致 性 
模型 都 有 其 复杂 度 ， 复 杂 度 较 高 的 模型 可 能 会 对 系统 的 性 能 产生 负面 影响 。 一 旦 选择 了 一 个 
一 致 性 模型 ， 在 分 布 式 系统 中 的 所 有 成 员 ， 包 括 程序 、DSM 以 及 目录 服务 都 必须 遵循 这 个 
模型 。 我 们 从 最 严格 、 最 复杂 的 模型 开始 介绍 ， 到 仅 有 较 少 限制 的 模型 结束 。 


9.3.1 严格 一 致 性 模型 


严格 一 致 性 模型 (strict consistency model) 对 事务 管理 系统 所 需要 确保 的 内 存 一 致 性 有 着 
最 强 的 要 求 。 有 一 点 很 明确 ， 读 操作 所 返回 的 值 必须 总 是 反映 最 近 更 新 的 结果 。 也 就 是 说 ， 
它 必须 返回 最 近 一 次 写 操 作 所 写 人 的 值 ， 而 无 论 是 谁 执行 了 这 一 项 写 操 作 ， 也 无 论 是 在 分 布 
式 系 统 中 的 何 处 执行 。 为 了 在 大 量 数据 中 识别 最 近 的 值 ， 就 需要 有 一 个 全 局 时 间 概 念 。 所 
以 ， 要 实现 严格 一 致 性 模型 ， 就 必须 采用 在 第 10 章 中 提 到 的 某 一 个 全 局 时 间 方 法 。 

即便 有 了 创建 全 局 时 间 的 方法 ， 要 求 在 分 布 式 系 统 中 采用 严格 一 致 性 也 不 明智 。 具 体 地 
说 ， 即 使 系统 相信 它 找到 了 最 近 更 新 的 值 ， 在 这 个 值 返 回 客户 端 之 前 的 瞬间 ， 此 数据 的 一 个 
新 值 仍然 可 能 写 人 。 可 能 当 这 个 刚刚 “过 期 ”的 值 开 始 向 网 络 上 的 目的 地 传输 的 时 候 ， 这 个 
值 已 经 重 写 人 。 所 以 ， 返 回 目的 地 的 值 已 经 不 是 最 近 的 值 了 ， 严 格 一 致 性 也 被 破坏 了 。 这 
样 ， 一 个 在 集中 式 环境 中 理 所 应 当 的 一 致 性 模型 在 分 布 式 环境 中 实际 上 并 不 能 够 实现 。 


9.3.2 顺序 一 致 性 模型 


顺序 一 致 性 模型 (sequential consistency model) 对 一 致 性 的 要 求 稍微 弱 一 点 ， 但 更 具 实 际 
意义 。 它 首先 由 Lamport 提出 【Lam79]。 顺 序 一 致 性 模型 要 求 分 布 式 系 统 中 所 有 成 员 和 它们 
的 进程 共享 一 个 通用 视图 ， 此 视图 记录 了 对 于 共享 内 存 访问 操作 的 顺序 。 它 不 保证 得 到 的 值 
是 最 近 更 新 的 结果 ， 所 以 ， 相 同 程序 的 两 次 运行 有 可 能 得 到 不 同 的 输出 结果 。 

为 了 理解 顺序 一 致 性 ， 我 们 再 来 回顾 一 下 9.2 节 中 的 例子 。 两 个 场景 都 是 符合 顺序 一 臻 
性 的 场景 ， 但 是 ， 一 些 成 员 看 到 场景 1 而 同时 另 一 些 成 员 却 看 到 场景 2 是 不 允许 的 。 如 果 一 
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个 成 员 看 到 Lynn 的 事务 首先 执行 ， 那 么 在 顺序 一 致 性 模型 中 所 有 的 成 员 都 将 共享 这 个 视图 。 

顺序 一 致 性 和 严格 -- 致 性 之 间 主 要 的 不 同 是 对 于 全 局 时 间 的 依赖 。 顺 序 一 致 性 并 不 依赖 
一 个 全 局 时 间 ， 而 更 强调 各 事件 保持 同一 的 顺序 。 这 个 方法 虽然 在 编写 应 用 程序 时 非常 直观 ， 
但 是 受到 一 个 重要 的 性 能 问题 的 困扰 一 一 读 写 性 能 之 间 是 反 关联 的 。 任 何 提升 读 操作 性 能 的 同 
时 也 降低 了 写 操作 的 性 能 ， 反 之 ， 提 升 写 操作 性 能 的 改进 也 会 降低 读 操作 的 性 能 [LiSa88]。 当 
然 ， 如 果 所 用 的 应 用 程序 绝 大 部 分 操作 只 是 读 操 作 的 话 ， 这 样 的 关系 可 能 就 是 有 用 的 特征 了 。 


9.3.3 偶然 一 致 性 模型 


偶然 一 致 性 模型 (casual consistency model) 是 由 Hutto 和 Ahamad 首先 提出 的 [HuAh90j。 
这 个 模型 比 顺序 一 致 性 更 进一步 放宽 了 对 一 致 性 限制 。 也 就 是 说 ， 不 是 所 有 事件 都 必须 以 相 
同 的 次 序 出 现在 分 布 式 系 统 中 的 所 有 成 员 面前 ， 只 有 那些 偶然 相关 (casually related) 的 事件 
才 需 要 。 如 果 事件 是 偶然 相关 的 ， 那 么 它们 就 必须 以 相同 而 且 是 正确 的 次 序 出现 。 这 使 得 我 
们 有 必要 给 偶然 相关 一 个 定义 ， 一 个 偶然 相 尖 的 事件 影响 会 与 其 偶然 相关 的 事件 。 如 果 事 件 
将 修改 同一 个 共享 数据 集合 ， 那 么 它们 就 是 偶然 相关 的 。 

举例 来 说 ， 如 果 你 读 出 余额 并 写 人 一 个 新 的 余额 ， 那 么 这 里 的 读 写 操作 就 是 偶然 相关 
的 。 这 样 ， 此 处 的 读 写 操作 不 但 要 以 相同 的 次 序 出 现在 所 有 人 面前 ， 而 且 读 操作 一 定 要 出 现 
在 写 操作 的 前 面 。 利 用 9.2 节 的 例子 ，Lynn 的 读 写 操 作 相 互 间 是 偶然 相关 的 Steven HES 
操作 相互 间 也 是 偶然 相关 的 。Lynn 和 Steven 的 事务 是 偶然 相关 的 ， 因 为 谁 的 事务 后 发 生 反映 
了 两 个 事务 发 生 的 结果 。 WR Susa 有 一 个 在 相同 银行 的 不 同 账户 ， 在 她 的 账户 上 操作 她 的 
事务 ,她 的 事务 和 Lynn、Steven 的 就 完全 没有 关系 ， 如 图 9-4 所 示 。Susan 的 事务 和 Lynn、 


Z BANK `> 


Lynn Lymn 和 Steven 的 
共享 账户 


J 
+452560.9*- 
6200-9 

$2000. 






T= B® 1-- 一 取出 $200 Susan 的 账户 
Ty: 事务 3 一 一 存 入 S200 $1200.% 
T 和 7 是 偶然 相关 的 。 Susan 


T, FASE EBA 
T, 中 的 动作 是 偶然 相关 的 ， 
T, 中 的 动作 是 偶然 相关 的 ， 
T, 和 了 ,不 是 偶然 相关 的 。 
TT 和 1 了 ,不 是 偶然 相关 的 。 





9-4 偶然 一 致 性 例子 
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Steven 的 就 不 是 偶然 相关 的 。 因 此 ， 偶 然 一 致 性 只 是 在 相关 的 事件 间 增 加 了 次 序 的 约束 。 这 
种 一 致 性 模型 经 常 采 用 几 种 不 同 的 关系 图 来 表示 。 这 种 有 时 称 为 依赖 图 的 关系 图 必须 记录 哪 
一 个 进程 看 到 了 哪 一 个 写 操作 ， 以 此 来 记录 偶然 关系 。 在 关系 图 中 没有 偶然 关系 的 事件 就 是 
无 关 的 事件 ， 也 就 不 受 这 种 一 致 性 模型 的 约束 。 这 些 无 关 的 事件 可 以 看 作 是 并 行 的 操作 ,并 
行 操作 可 以 认为 是 在 不 同 的 地 方 以 不 同 顺序 发 生 的 。 


9.3.4 PRAM 一 致 性 模型 





管道 随机 存 取 内 存 (pipelined random access memory, PRAM) 一 致 性 模型 最 早 是 由 Lipton 
和 Sandberg 首先 提出 的 【LiSa88 |。 这 个 模型 比 偶然 一 致 性 对 一 致 性 的 要 求 更 弱 一 些 。 明 确 地 
说 ， 只 有 一 个 进程 内 的 写 操作 才 被 要 求 以 它们 执行 的 顺序 出 现在 其 他 进程 均 能 看 到 的 祝 图 
中 ， 如 图 9-5 所 示 。 每 个 进程 可 以 想象 这 些 操作 处 于 一 个 先进 先 出 的 队列 或 管 程 中 ， 注 意 这 
里 没有 提 到 关于 其 他 成 员 的 顺序 。 每 一 个 成 员 可 以 以 任意 次 序 看 到 这 些 来 源 于 多 个 位 置 的 操 
作 ， 但 是 从 同一 位 置 来 的 操作 之 间 的 次 序 必须 保证 不 变 。 也 就 是 说 ， 在 每 个 地 点 看 来 ， 从 同 
一 位 置 来 的 操作 之 间 的 事务 顺序 是 相同 的 ， 而 它们 和 系统 中 其 他 来 自 不 同位 置 的 操作 之 间 的 
顺序 则 因 观 察 地 点 的 变化 而 有 可 能 不 同 。 结 论 就 是 不 同位 置 在 视图 中 是 允许 并 行 操作 的 。 


不 正确 的 PRAM "一致 性 
















BEE 1 进程 2 
本 地 动作 
污 foo HE goo 
5 foo PW) 23 BP, W) 
写 foo P W) F gop W,) 
写 操作 必须 以 相同 的 顺序 在 所 有 的 进程 前 出 现 
正确 的 PRAM 一 致 性 


进程 1 进程 2 







TE foo 
foot P, W) 
T foo? W) 
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K 9-5 PRAM 一 致 性 模型 举例 


9.3.5 处 理 器 一 致 性 模型 


Goodman 提出 的 处 理 器 -- 致 性 模型 [Goo89] 与 PRAM 一 致 性 非常 类 似 ， 有 时 还 容易 混 
淆 ， 实 际 上 它 的 限制 更 紧 些 。 它 的 要 求 和 PRAM 一 致 性 一 样 ， 还 要 加 上 一 个 存储 一 致 性 的 条 


218; 





219 


148 DAKAR: 原理 与 实践 





件 。 所 以 ,不 仅 给 定位 置 的 所 有 操作 必须 管 程 化 ， 而 且 对 于 任意 一 个 特定 的 存储 位 置 ， 整 个 
系统 必须 就 此 位 置 的 所 有 写 操 作 顺 序 达 成 一 致 ， 如 图 9-6 所 示 。Goodman 没有 给 出 在 处 理 器 
一 致 性 模型 中 对 读 访 问 顺序 的 要 求 ，Ghorechorloo 等 人 给 出 了 以 下 两 个 条 件 [CLLGGH90]。 


不 正确 的 例子 


_ Hei 进程 2 
本 地 动作 本 地 动作 全 局 视图 f 
读 foo 
ES foo(P,,W/,) 
写 foo(P W) 










因为 所 有 的 写 操作 是 对 于 同一 位 置 的 ， 
所 以 必须 以 相 回 壬 序 在 视图 中 出 现 ! 


正确 的 例子 









读 foo 
号 jpoP Ww) 
写 joo(P,,W,) 





访 向 同一 内 存 位 秆 的 相同 全 局 视图 。 


图 9-6 ”处理 器 一 致 性 例子 


1. 一 个 在 其 他 位 置 执行 的 读 操 作 必 须 等 它 之 前 的 读 访 问 都 完成 后 才能 执行 。 

2. 一 个 写 操作 必须 等 它 之 前 的 读 写 操作 都 完成 后 才能 执行 。 

这 些 条 件 允 许 一 个 在 写 操作 之 后 的 读 操作 绕 过 写 操 作 执 行 。Ghorechorloo 等 人 指出 ， 为 
了 防止 死 锁 ， 使 用 处 理 器 一 致 性 模型 的 实现 必须 保证 所 有 的 写 操作 最 后 都 能 被 执行 。 


9.3.6 Rte 


弱 一 致 性 模型 是 由 Dubois 等 人 提出 的 【DSB86，DSB88]。 这 个 模型 的 定义 要 用 到 一 种 新 
的 变量 ， 即 用 作 同 步 存 储 的 同步 变量 (synchronization variable)。 同 步 变量 用 作 向 其 他 机 器 传 
播 写 操作 ， 以 及 对 于 全 局 数据 在 分 布 式 系统 中 其 他 地 方 出 现 的 修改 作 本 地 更 新 ， 如 图 9-7 所 
示 。 因 此 ， 同 步 变 量 可 以 作为 组 存储 的 引用 。 利 用 同步 变量 ， 我 们 现在 来 定义 弱 一 致 性 的 三 
个 要 求 。 

1. 访问 同步 变量 要 遵循 顺序 一 致 性 模型 。 

2. 对 同步 变量 进行 的 访问 必须 等 它 之 前 的 写 操 作 在 分 布 式 系统 中 的 所 有 地 方 都 执行 了 
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位 里 1 


L 间 步 变量 
eth PAE 
更 新 值 
执行 读 操作 











U 
U 


位 置 2 
U 
w 
= | 
位 置 3 





图 9-7 在 弱 一 致 性 中 应 用 同步 变量 
后 才能 进行 。 

3. 对 非 同 步 变 量 的 访问 〈 甚 至 只 是 读 操 作 ) 只 有 在 之 前 的 所 有 对 同步 变量 的 访问 都 完 
成 后 才能 进行 。 

因此 ,第 1 点 说 明 所 有 分 布 式 系统 中 的 进程 共享 一 个 记录 同步 变量 访问 操作 顺序 的 通用 
视图 。 回 想 一 人 下， 顺序 一 致 性 模型 并 不 保证 所 获得 的 值 是 最 近 更 新 的 。 然 而 第 2 点 要 求 所 有 
位 置 完 成 所 有 正在 处 理 或 者 已 处 理 完 但 还 没有 写 的 写 操 作 。 这 样 ， 通 过 在 读 操 作 前 执行 同 
步 ， 程 序 就 能 确保 它 从 内 存 中 取出 的 值 是 最 新 的 。 如 果 在 修改 共享 数据 后 执行 同步 ， 程 序 就 
能 将 新 的 值 传递 到 系统 中 各 个 位 置 。 由 于 第 3 点 防止 了 在 使 用 同步 变量 时 对 非 同步 变 量 的 访 
问 ， 也 可 以 通过 在 访问 共享 数据 前 执行 同步 来 确保 最 新 的 值 。 

这 个 模型 比 其 他 模型 具有 更 好 的 性 能 ， 具 有 以 下 的 优点 : 

4 分布 式 系统 中 许多 (经常 是 绝 大 部 分 ) 成 员 不 需要 看 到 所 有 的 写 操作 。 

4 分 布 式 系统 中 许多 (经 常 是 绝 大 部 分 ) 成 员 不 需要 看 到 中 间 的 写 操 作 。 实 际 上 ， 如 果 

这 些 中 间 结 果 是 由 于 在 临界 区 中 的 操作 引起 的 话 ， 就 根本 不 应 看 到 。 

最 后 ， 弱 一 致 性 利用 顺序 一 致 的 同步 变量 对 内 存 引用 进行 分 组 。 由 于 同步 变量 所 引起 的 
额外 开销 ， 相 对 于 寻常 的 、 单 独 的 逐个 存储 操作 ,聚集 地 访问 共享 数据 ， 并 且 每 次 珍 集 都 执 
行 许多 存储 操作 能 取得 更 丙 的 性 能 。 如 果 程 序 中 有 很 多 单独 的 独立 的 存储 操作 ， 它 就 不 能 很 
好 地 利用 弱 一 致 性 所 给 予 的 成 组 存储 引用 的 优点 。 尽 管 弱 一 致 性 能 提高 性 能 ， 但 同时 它 也 增 
加 了 对 使 用 这 一 模型 的 开发 者 、 设 计 者 和 程序 员 的 负担 ， 因 为 操作 局 部 或 者 全 局 同步 变量 将 
牵涉 到 所 有 共享 变量 的 更 新 。 系 统 不 能 分 辨 访问 同步 变量 进行 同步 操作 到 底 是 为 了 在 系统 中 
读数 据 还 是 为 了 分 送 一 个 新 写 入 的 值 。 两 种 情况 下 ， 弱 一 致 性 都 要 分 送 所 有 的 写 操 作 ， 并 更 
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新 数据 的 本 地 拷贝 。 
9.3.7 释放 一 致 性 模型 


释放 一 致 性 模型 是 由 Gharachorloo 等 人 提出 的 【GLLGGH90」， 与 弱 一 致 性 有 些 类 似 , 但 
是 释放 一 致 性 具有 了 分 辨 进入 临界 区 前 的 同步 动作 和 退出 临界 区 后 的 间 步 动作 的 能 力 。 也 就 
是 说 ， 释 放 一 致 性 提供 了 获得 访问 权 (acquire access) 和 释放 访问 权 (release access)。 获 得 
访问 权 用 来 通知 系统 进程 正 准 备 进 和 人 临界 区 ， 这 种 情况 下 ， 所 有 其 他 成 员 所 作 的 修改 结果 都 
要 加 以 传播 ， 并 由 本 地 的 处 理 器 来 更 新 。 释 放 访问 权 是 用 来 通知 系统 ， 进 程 正在 退出 临界 
区 ， 对 共享 内 存 所 作 的 本 地 修改 将 传播 到 其 他 的 各 个 成 员 。 这 使 得 释放 一 致 性 只 要 对 每 一 种 
特定 的 同步 操作 采取 适当 动作 就 能 获得 比 弱 一 致 性 更 高 的 性 能 ， 如 图 9-8 所 示 。 


iial 位 置 2 








释放 访问 权 


获得 访问 权 读 





位 置 4 位 置 3 


图 9-8 释放 一 致 性 中 使 用 获得 访问 权 和 释放 访问 权 


如 果 不 利 用 临界 区 ， 释 放 一 致 性 提供 了 栅栏 barrier)。 栅 栏 通过 区 分 执行 的 不 同 阶段 来 
提供 同步 。 在 第 n 阶段 中 使 用 的 栅栏 在 所 有 的 进程 都 结束 第 n 阶段 之 前 不 允许 任何 进程 进入 
第 n+ 1 阶段 。 如 果 你 把 整个 的 一 个 阶段 作为 临界 区 的 话 ， 应 用 带 栅栏 的 获得 和 释放 访问 权 
的 方法 同 临界 区 的 实现 实际 是 等 效 的 。 对 应 起 来 ， 进程 进入 一 个 新 阶段 时 ， 它 获得 了 访问 
权 。 当 它 到 达 栅 栏 的 时 候 ， 它 就 要 淋 放 访问 权 。 通 常 使 用 一 个 集中 式 的 服务 器 来 保证 所 有 相 
关 的 进程 都 结束 了 给 定 的 阶段 。 一 旦 服务 器 认定 一 个 阶段 已 经 结束 了 ， 它 将 通知 所 有 处 理 器 
可 以 进入 下 一 阶段 了 。 

释放 一 致 性 使 得 指定 一 个 变量 保持 一 致 性 成 为 可 能 ， 尤 其 是 它 不 需要 所 有 的 变量 都 保持 
一 致 性 ， 只 有 那些 指定 为 保护 性 的 才 需 要 。 那 些 指定 为 保护 性 的 变量 或 存储 部 分 一 定 要 遵从 
以 下 规定 ,这 些 规定 是 依 根 释放 一 致 性 模型 建立 的 。 
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1. 一 个 进程 访问 共享 变量 之 前 ， 它 之 前 所 获得 的 所 有 访问 权 必 须 都 已 成 功 结束 操作 。 

2. 释放 访问 权 之 前 ， 必 须 结 束 所 有 读 写 操作 。 

3. 所 有 的 获得 访问 权 和 释放 访问 权 都 必须 遵从 处 理 器 一 致 性 模型 。 

释放 一 致 性 允许 相互 无 关 的 获得 、 释 放 访 问 权 和 栅栏 各 自 独立 地 发 挥 作 用 。 一 个 采用 条 
放 一 致 性 的 DSM 系统 可 以 获得 和 采用 顺序 一 致 性 模型 的 DSM 系统 相同 的 结果 。Gharachorloo 
等 人 在 {GLLGGH9%0 | 指出 只 要 遵循 这 三 个 条 件 和 释放 一 致 性 模型 ， 正 确 使 用 获得 访问 权 和 
释放 访问 权 同 步 工 具 ， 就 能 获得 这 个 结果 。 


9.3.8 懒 释放 一 致 性 


懒 释 放 一 致 性 (lazy release consistency) 模型 是 在 1992 年 由 Keleher 等 人 提出 的 
[KC2Z92]。 基 本 的 释放 一 致 性 模型 相对 于 弱 一 致 性 模型 确实 提高 了 性 能 ， 但 还 可 以 再 进一步 
提高 。 在 释放 一 致 性 模型 中 ， 释 放 访 问 权 是 用 来 通知 系统 进程 正在 退出 临界 区 ， 对 共享 内 存 
所 作 的 本 地 修改 将 传播 到 其 他 各 个 成 员 。 在 懒 释放 一 致 性 模型 中 ， 这 些 修改 不 是 马上 进行 传 
播 的 ， 而 是 只 在 要 求 传播 时 才 传 送 到 网 络 上 。 盟 确 地 说 ， 对 共享 数据 的 改变 只 有 在 其 他 位 置 
获得 访问 权 的 时 候 才 被 传达 到 。 释 放 一 致 性 的 其 他 方面 都 保持 不 变 。 这 一 点 变更 提高 了 性 
能 ， 尤 其 是 在 网 络 流 量 方面 。 如 果 一 个 地 点 不 访问 共享 变量 ， 变 量 的 修改 就 不 会 通知 到 人 亡 ， 
如 图 9-9 所 示 ， 可 与 图 9-8 进行 比较 。 

位 置 1 位 置 2 


效 得 访问 权 
临界 区 


释放 访问 权 


| 


po —_ <— —_ 
W= 号 操作 
U= 更 新 操作 : 









获得 访问 权 读 


图 9-9 懒 释 放 一 致 性 
9.3.9 入 口 一 致 性 模型 


入 口 释放 一 致 性 (ertry release consistency) 模型 是 由 Bershad 等 人 提出 的 [ BeZe91, 
BZS931]。 这 个 模型 和 基本 的 释放 一 致 性 模型 有 些 类 似 。 除 了 利用 获得 访问 权 和 释放 访问 权 的 
方法 外 ， 入 口 一 致 性 模型 要 求 每 个 变量 与 一 种 同步 变量 相关 联 ， 例 如 锁 或 者 栅栏 。 这 种 相关 
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联 的 要 求 增加 了 程序 员额 外 的 负担 ， 但 同时 也 获得 了 更 高 的 性 能 。 如 果 这 种 方法 能 正确 运用 
《就 是 运用 适当 的 同步 技术 ) ， 共 享 内 存 的 访问 就 能 持续 地 保持 一 致 。 


9.4 两 阶段 提交 协议 


绝 大 多 数 事务 依赖 于 Gray 首先 提出 的 两 阶段 提交 协议 (Two-Phase Commit Protocol ) 
[Gra781。 其 目的 是 保证 在 分 布 式 系 统 中 所 有 的 事务 能 自动 发 生 ， 在 一 个 不 变 的 状态 下 保持 
数据 。 这 个 协议 包含 了 以 下 两 个 阶段 。 

1. 准备 提交 阶段 。 

2. 提交 阶段 。 

一 般 来 讲 ， 第 一 阶段 是 为 完成 事务 而 进行 协商 和 准备 的 阶段 ， 第 二 阶段 是 依照 协定 执行 
事务 的 阶段 。 两 个 阶段 如 图 9-10 所 示 ， 我 们 现在 分 别 进行 讨论 。 


准备 提交 阶段 
协调 者 










T= 事务 1 
5, = R63 | 
S= RGB 2 


提交 阶段 





图 9-10 两 阶段 提交 协议 
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9.4.1 准备 提交 阶段 


两 阶段 提交 协议 为 每 个 事务 引入 一 个 协调 者 ,一 般 是 发 起 地 点 。 协 调 者 负责 征求 和 接收 
执行 事务 所 必需 的 服务 器 的 提交 。 以 下 是 执行 的 步骤 。 

4 识别 什么 资源 是 必需 的 ， 要 接触 哪些 地 方 的 成 员 。 225 

4 与 所 要 求 的 场所 接触 ,请求 它们 提交 以 完成 动作 。 

4 记录 每 个 所 接触 的 服务 器 发 回 的 回应 。 

4 如 果 一 个 服务 器 无 回应 或 者 做 出 否定 的 回应 ,试图 征求 其 他 服务 器 对 提交 的 支持 。 226 

当 一 个 服务 器 接收 到 一 个 请 求 ， 它 必须 决定 它 是 否 能 够 完成 这 个 请 求 。 一 旦 一 个 服务 
器 提交 了 一 件 事务 , 它 就 不 管 怎样 都 必须 完成 此 事务 。 一 个 事务 请 求 的 提交 回应 就 像 一 个 
有 约束 力 的 合同 ,然而 有 一 点 要 注意 ， 一 个 服务 器 接收 到 一 个 请 求 并 发 送 一 个 提交 回应 以 
示 接 受 并 不 代表 事务 就 会 发 生 。 具 体 地 说 ， 直 到 进入 提交 阶段 ， 事务 还 只 是 计划 中 的 事 
务 。 一 个 地 点 的 成 员 可 以 在 收 到 请 求 的 时 候 就 开始 执行 事务 , 但 是 如 果 事 务 在 进入 提交 阶 
段 前 被 取消 ， 它 就 必须 作 好 回 滚 的 准备 。 回 深意 味 着 在 执行 事务 的 任 一 阶段 之 前 将 所 有 数 
据 全 部 返回 其 原 有 状态 。 所 以 ， 在 完成 事务 的 各 个 部 分 之 前 ， 必 须 记 录 下 所 有 的 原 有 状 
态 。 最 后 数据 的 结果 是 看 上 去 事务 任何 部 分 没有 执行 过 ， 数 据 也 处 在 安全 、 原 始 、 固 定 的 
状态 。 

关于 进入 提交 阶段 的 问题 仍然 存在 。 为 了 进入 提交 阶段 ， 事 务 协调 者 必须 收 到 事务 的 所 
有 方面 的 提交 消息 。 并 且 仪 在 这 一 点 上 ， 事 务 协调 者 向 每 个 提交 地 点 发 出 一 个 提交 消息 ， 然 
后 事务 处 理 进入 第 二 阶段 一 一 提交 阶段 。 如 果 事 务 协 调 者 没有 收 到 事务 所 有 方面 的 提交 消息 
《可 能 是 由 于 缺少 应 答 ) ， 就 不 能 进入 第 二 阶段 。 这 时 事务 协调 者 必须 通知 服务 器 ， 而 服务 器 
必须 回 滚 所 有 为 了 完成 它 的 那 部 分 事务 而 执行 的 动作 。 这 样 ， 完 成 事务 的 失败 企图 就 不 会 影 
响 到 系统 的 状态 了 。 注 意 : 只 有 协调 者 有 权力 放弃 事务 ， 一 旦 一 个 服务 器 返回 了 提交 消息 ， 
它 就 不 能 改变 决定 了 。 


9.4.2 提交 阶段 


一 旦 提交 消息 被 接收 列 ， 服 务 器 就 可 以 返回 它们 的 执行 结果 ， 并 认为 所 作 的 更 改 是 永久 
的 。 所 有 的 服务 器 都 完成 了 各 自 的 动作 后 ， 事 务 就 完成 了 。 听 上 去 很 简单 ， 但 是 如 果 一 个 提 
SEH AR SF ab ABE TE A I? 

为 了 让 两 阶段 提交 协议 正常 运作 ， 它 必须 能 承受 系统 故障 。 为 了 达到 这 一 点 ， 每 个 收 到 
提交 请 求 的 服务 器 要 把 此 请 求 记录 在 非 易 失 性 存储 器 中 。 这 一 步 要 在 服务 器 向 协调 者 返回 消 
息 之 前 完成 ， 以 防 因 为 服务 器 在 返回 消息 和 记录 请 求 之 间 发 生 的 崩溃 而 导致 的 混乱 。 除 此 以 
外 ， 从 事务 协调 者 发 出 的 提交 消息 和 协调 者 那里 的 事务 状态 也 要 记录 在 非 易 失 性 存储 器 中 。 
这 样 ， 所 有 的 成 员 ， 包 括 协 调 者 ， 都 存 有 一 个 关于 它们 对 于 事务 状态 的 职责 的 可 靠 复制 。 当 
任何 成 员 (包括 协调 者 ) 从 骨 溃 中 恢复 的 时 候 ， 它 检查 非 易 失 性 存储 器 和 这 些 防 止 崩 省 的 记 
录 。 如 果 有 提交 事务 的 记录 ， 风 它 马 上 去 完成 那 部 分 的 事务 工作 ;如果 这 个 成 员 不 是 协调 者 [227 
并 且 有 记录 将 要 提交 事务 ， 但 是 没有 从 协调 者 发 送 来 的 确认 信息 ， 则 它 必 须 与 协调 者 联系 ， 
以 检查 是 否 进 入 了 提交 阶段 。 
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9.5 REFS 


事务 可 以 是 简单 事务 或 者 鼻 合 事务 (compound transaction), LASFAA SitZKES 
务 ， 而 简单 事务 则 不 是 。 复 合 事务 中 的 每 个 嵌 套 事务 也 可 以 是 一 个 包含 了 许多 骸 套 事务 的 复 
合 事 务 。 复 合 事务 可 以 形象 地 用 树 来 表示 ， 原 来 的 事务 就 是 父 结 点 ， 蔷 套 事务 的 第 一 层 就 是 
树 中 的 下 一 层 。 包 含 在 父 结 点 中 的 事务 有 时 也 称 为 子 事务 。 设 计 和 组 织带 有 艇 套子 事务 的 事 








务 有 以 下 几 点 好 处 : 

4 提高 并 发 性 。 

4 提高 性 能 。 

4 提高 容错 性 。 

利用 并 发 控制 ， 处 于 同一 层次 的 子 事务 可 以 同时 执行 。 这 种 同时 执行 增加 了 并 发 执行 的 
能 力 ， 同 时 也 提高 了 性 能 。 每 一 个 子 事务 各 自 独立 地 提交 和 中 止 。 所 有 子 事务 必须 在 父 事务 


进入 提交 阶段 前 完成 提 变 。 如 果 一 个 子 事务 中 途 退 出 ， 父 事务 可 以 有 几 种 方法 来 完成 子 事 
务 ， 包 括 重新 选择 一 个 客户 来 执行 。 每 一 个 子 事务 都 有 其 子 目 标 和 父 事 务 的 检查 点 ， 因 此 整 
下 re 此 外 ， 每 个 子 事务 都 具有 并 遵从 所 有 的 ACID 特性 。 因 

此 ， 子 事务 的 结果 只 在 结束 的 时 候 才 对 其 父 事务 可 见 ， 每 个 子 事务 都 看 作 一 个 原子 操作 。 最 
后 ， 加 果 久 事务 决定 它 无 法 进入 提交 阶段 事务 和 与 其 相关 的 嵌 套 事务 必须 回 深 。 详 细 说 明 


[228] 9.4 和 9.5 5 分 别 给 出 了 多 套 事务 的 准备 提交 阶段 和 提交 阶段 的 得 法 。 
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”1 加 入 则 结 来 。 准 备 提交 阶段 。 可 以 增 
| 11 加 有 关 如 果 不 能 进入 提交 阶段 而 采取 
1/ 而 作 的 其 他 条 件 ， 或 者 调整 进入 提交 
BRAME 








9.6 事务 实现 中 的 问题 


虽然 事务 系统 的 实现 看 上 去 很 简单 ， 这 一 节 还 是 要 给 出 事务 系统 实现 中 会 遇 到 的 困难 和 
问题 。 为 了 保证 正确 的 事务 ,这些 问题 必须 避免 ， 同 时 必须 遵守 ACID 特性 。 


9.6.1 预 读 写 


在 9.1 节 中 ， 我 们 看 到 了 不 采用 事务 而 导致 的 两 个 问题 。 不 幸 的 是 ， 如 果 利 用 没有 正确 
实现 的 事务 ， 同 样 会 产生 这 样 的 问题 。 其 他 可 能 发 生 的 有 关 问 题 包 括 了 预 读 写 。 一 个 事务 对 
一 个 数据 进行 读 操 作 ， 而 这 个 数据 正在 被 其 他 将 要 退出 的 事务 操作 ， 这 时 预 读 的 问题 就 发 生 
了 。 如 果 一 个 事务 对 一 个 数据 进行 写 操作 ， 而 这 个 数据 正在 被 另 一 个 事务 操作 ， 就 产生 了 预 
写 的 问题 。 两 个 问题 的 发 生 都 牵涉 到 独立 事务 的 相互 作用 ， 事 务 管理 服务 采用 延迟 执行 就 可 
以 避免 这 些 问 题 的 发 生 。 延 迟 执行 使 得 正在 被 事务 操作 的 数据 不 能 被 其 他 事务 读 写 ， 直 到 当 
前 事务 进入 提交 阶段 或 者 中 途 退 出 。 少 量 的 延迟 会 稍微 降低 系统 的 性 能 ,但 是 它 保证 了 事务 
独立 性 的 保持 和 加 强 。 


9.6.2 中 途 退 出 的 多 米 诺 效应 


如 果 一 个 事务 不 能 进入 提交 阶段 ， 它 就 有 必要 退出 。 如 果 其 他 事务 看 到 了 与 退出 的 事务 
有 关 的 结果 ， 这 个 事务 的 退出 可 能 遭受 多 米 诺 效应 (Domino Fffect)。 这 种 多 米 诺 效应 特别 在 
事务 管理 系统 遭 到 预 写 操作 后 可 能 发 生 。 任 何以 预 写 的 数据 为 执行 基础 的 事务 在 预 写 的 事务 
中 途 退 出 后 也 都 必须 退出 。 同 样 ， 任 何 利用 第 二 代 退 出 事务 结果 的 事务 都 要 退出 。 这 种 因 中 
途 退 出 而 导致 的 结果 是 很 惊人 的 。 


9.6.3 保证 恢复 能 力 


下 面 的 两 个 步骤 将 极 大 提高 事务 管理 系统 的 恢复 能 力 ， 我 们 主要 的 目标 是 保证 ACD 特 
性 得 以 确认 。 
© 如 果 另 一 个 未 完成 的 提交 请 求 奉 涉 到 相同 的 数据 ， 则 应 延迟 当前 的 提交 。 这 也 有 助 于 
防止 因 退 出 而 产生 的 多 米 诺 效应 。 
4 利用 数据 的 本 地 暂时 拷贝 直到 正式 进入 提交 阶段 。 暂 时 拷贝 可 以 保存 在 本 地 的 易 失 存 
储 器 中 。 如 果 一 直 不 进入 提交 阶段 ， 则 删除 暂时 拷贝 。 如 果 进 入 提交 阶段 ， 则 把 暂时 
拷贝 复制 到 永久 的 不 易 丢 失 的 存储 器 中 。 这 一 步 也 有 助 于 减少 或 消除 预 读 写 的 发 生 ， 
因为 暂时 拷贝 是 保存 在 本 地 的 。 


9.7 小 结 
在 这 一 章 中 ， 我 们 学 习 了 分 布 式 系 统 中 非常 重要 的 一 个 题目 一 一 事务 管理 。 事 务 管理 用 
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来 保证 DSM 和 目录 服务 中 数据 操作 的 正常 进行 。 要 保证 事务 管理 的 成 功 ， 就 需要 在 系统 发 
生 故 障 的 时 候 能 够 回复 并 继续 运作 。 也 就 是 说 ， 它 必须 具有 容错 性 。 在 关于 两 阶段 提交 协议 
的 讨论 中 ， 我 们 已 经 看 到 实现 一 个 容错 的 事务 管理 系统 是 可 能 的 。 


表 9-1 一 致 性 模型 及 其 要 求 的 小 结 








一 致 性 模型 要 k 

严格 BE 必须 总 是 读 取 最 近 更 新 的 值 。 依 束 全 局 时 间 

顺序 一 致 性 一 起 共享 通 用 的 全 局 视图 。 依 赖 全 局 次 序 

偶然 一 致 性 偶然 相关 的 事件 必须 以 相同 的 顺序 在 视图 中 出 现 

PRAM 一 致 性 一 个 进 泪 中 的 所 有 的 写 操作 必须 以 相同 的 顺序 出 现在 所 有 的 系统 中 

处 理 器 一 致 性 PRAM -- 致 性 加 上 存储 一 致 性 。 所 在 给 定位 置 的 操作 都 必须 在 整个 系统 内 有 一 致 的 顺序 
弱 一 致 性 利用 间 步 变量 来 执行 写 操作 和 更 新 操作 。 同 步 变 量 的 访问 必须 遵循 顺序 一 致 性 。 全 部 的 


读 写 操作 必须 在 释放 访问 权 前 完成 。 最 后 ， 所 有 的 得 到 和 释放 访问 权 必须 遵循 处 理 器 一 至 
性 模型 ， 无 关 数 据 的 同步 变量 可 以 独立 并 行 地 运行 

释放 一 致 性 模型 与 弱 一 牙 性 相同 ， 但 是 把 同步 动作 分 为 获得 访问 权 和 释放 访问 权 。 获 得 访问 权 在 进 人 临 
界 区 时 执行 ， 并 处 理 所 有 更 新 。 释 放 访 问 权 在 临界 区 结束 时 执行 ， 并 分 发 所 有 修改 结果 。 
这 个 模型 司 时 也 支持 栅栏 的 概念 


WER- BERN 除了 只 有 在 要 求 时 才 进 行 修改 结果 的 传送 外 ， 与 释放 一 致 性 相同 
人 口 一 致 性 模型 除了 所 有 的 同步 变量 都 要 与 锁 这 样 的 同步 变量 相关 联 外 ， 与 释放 一 致 性 相同 


如 果 不 能 保证 数据 的 一 至 性， 任何 操作 系统 或 者 在 操作 系统 中 的 事务 管理 服务 都 将 是 不 
胜任 的 。 在 这 一 章 中 ， 我 们 学 习 了 数据 一 致 性 的 确切 涵义 ， 还 考察 了 大 量 通用 的 模型 。 表 (232 
9-1 是 各 模型 以 及 它们 相关 要 求 的 一 个 小 结 。 数 据 一 致 性 也 许 比较 复杂 ， 不 熟悉 分 布 式 系统 
的 开发 者 也 许 会 错误 地 认为 数据 一 致 性 是 当然 的 。 就 像 对 一 个 集中 式 的 程序 员 来 讲 ， 理 解 一 
种 语言 中 的 几 种 参数 传递 方式 是 很 重要 的 一 样 ， 分 布 式 环境 中 的 开发 首 必 须 对 所 采用 的 数据 
一 致 性 模型 有 相当 透彻 完整 的 理解 。 理 解 此 模型 有 助 于 保证 适当 的 开发 、 执 行 以 及 对 环境 的 
解释 。 现 在 有 几 种 严格 程度 不 同 的 模型 ， 很 多 研究 者 发 现 那 些 不 很 严格 的 一 致 性 模型 不 但 很 
适合 ， 而 且 效率 很 高 。 对 需要 考虑 网 络 延 迟 的 人 来 讲 这 是 一 个 非常 重要 的 方面 。 在 不 远 的 未 
来 ， 发 现 胜任 而 且 有 效率 的 一 致 性 模型 并 将 其 运用 于 事务 管理 服务 中 仍 将 是 一 个 活跃 的 研究 
领域 。 


9.8 参考 文献 


第 1 章 中 列 出 的 大 多 数 参 考 资料 都 可 以 提供 有 关 事 务 管 理 的 一 般 信息 。[Prim95] 中 描 
WY Tuxedo 在 线 事务 处 理 系 统 。 另 外 ， 以 下 的 书籍 可 能 提供 其 他 一 些 有 用 的 信息 : 
[GrRe93，Jal94，PIM98， 以 及 RaCh9%6]j。 一 些 典型 的 有 关 这 一 章 信息 的 研究 论文 包括 
[ AdHi90, BeZe91, BZS93, DSB86, DSB88, GGH91, Goo89, GLLGGH90, Gra78, HaRe83, 
HuAh90, ISL96, KCZ92, Lam79, Lam81, LiHu89, LiSa88, ShSn88, Wei91, LAR Wei93]。 

以 下 是 有 关 Transarc 公司 及 其 商业 事务 管理 产品 Encina™ 信 息 的 网 站 ; www.transare. com, 
你 也 可 以 在 第 1 章 中 列 出 的 网 站 中 搜寻 到 有 关 信 息 。 


习题 
91 描述 三 个 用 到 事务 管理 的 日 常 实例 。 对 每 个 实例 讨论 遇 到 更 新 遗失 和 恢复 不 一 臻 
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9.2 


9.3 
9.4 


9.5 


9.6 


9.7 
9.8 


9.9 





问题 的 后 果 。 

对 事务 的 ACID 特性 中 的 每 一 项 ， 描 述 一 个 如 果 不 遵守 这 项 特性 将 会 导致 不 正确 的 
事务 的 场景 。 

如 果 不 遵 守 事 务 的 独立 性 ， 将 会 出 现 哪 些 危险 和 潜在 的 问题 ? 

指出 四 个 受 分 布 式 操作 系统 选择 的 一 致 性 模型 影响 的 专业 领域 ， 描 述 一 致 性 模型 
的 选择 是 如 何 影响 每 个 领域 的 。 

为 以 下 每 条 说 明 描 述 一 个 例子 。 

a. 一 组 遵循 顺序 一 致 性 但 是 不 遵循 偶然 一 致 性 的 动作 。 

b. 一 组 遵循 偶然 一 致 性 但 是 不 遵循 PRAM 一 致 性 的 动作 。 

c. 一 组 遵循 处 理 器 一 致 性 但 是 不 订 循 PRAM 一 致 性 的 动作 。 

描述 以 下 一 致 性 模型 的 优 缺点 。 

a. 55— BLE. 

b. 释放 一 致 性 。 

c. 懒 释 放 一致 性 。 

d. 人 口 一 致 性 。 

事务 管理 服务 是 怎样 为 整个 分 布 式 操作 系统 的 容错 性 能 作 贡 献 的 ?” 举例 说 明 。 

在 什么 情况 下 ， 一 个 已 经 接受 事务 请 求 的 客户 会 被 迫 回 滚 ? 描述 一 个 文件 服务 可 
能 采用 的 保证 执行 回 滚 的 方法 。 

两 阶段 提交 协议 中 ， 为 什么 不 允许 客户 改变 关于 接受 事务 请 求 的 决定 ? 


9.10 描述 由 于 允许 事务 包含 艇 套 事务 而 产生 的 三 个 优点 和 三 个 随 之 而 来 的 问题 。 


S108 分布 式 同步 


同步 需要 全 局 时 间或 全 局 排序 来 实现 。 集 中 式 系 统 中 时 间 的 概念 实际 上 非常 简单 ， 所 
有 进程 都 使 用 同一 系统 中 的 时 钟 。 相 反 ， 分 布 式 系统 中 的 时 间 非 常 像 在 第 一 天 上 课时 把 教 
室内 所 有 人 的 手表 调整 到 同一 时 刻 。 如 何 使 他 们 在 期 终 考 试 时 则 步 呢 ? 在 这 一 章 中 ,我 们 
将 探究 与 全 局 时 间 及 其 替代 方法 一 一 全 局 排序 有 关 的 问题 。10.1 节 给 出 了 有 关 全 局 时 间 
概念 的 总 体 介绍 .10.2 节 讨 论 有 关 物 理 时 间 的 问题 和 算法 。10.3 节 描 述 了 一 个 Internet 上 的 
物理 时 间 标 准 一 一 网 络 时 间 协 议 (NIP)。10.4 节 讨 论 有 关 还 辑 时 间 和 逻辑 排序 的 问题 和 
算法 。 


10.1 全 局 时 间 介 绍 


一 个 分 布 式 系 统 包含 很 多 不 同 的 地 点 和 个 别 的 计算 机 系统 ， 每 一 个 地 点 和 系统 都 有 其 各 
自 的 本 地 时 钟 。 即 使 有 可 能 在 某 一 时 刻 让 所 有 的 时 钟 同步 ， 各 处 系统 时 钟 也 会 偏 移 (drift- 
ing)， 这 和 我 们 手腕 上 的 手表 没什么 不 同 。 偏 移 就 是 因为 各 个 计时 机 制 中 微小 的 不 精确 性 而 
引起 的 ， 和 致使 一 度 同 步 的 时 钟 逐 渐变 得 不 一 致 。 在 我 们 对 高 级 系统 的 研究 中 ， 已 经 看 到 了 很 
多 需要 某 种 程度 的 全 局 时 间 (global time) 或 全 局 排序 的 协议 。 全 局 时 间 用 来 给 进程 和 数据 
提供 时 间 惟 。 如 果 一 个 成 员 的 时 钟 走 得 慢 了 比如 说 时 钟 是 9%:15， 而 实际 上 是 9:25)， 那 么 
所 有 在 那个 地 点 的 进程 将 在 整个 系统 中 得 到 不 公平 的 待遇 。 在 时 钟 不 正确 的 系统 中 ， 每 个 进 
程 或 动作 将 显得 比 实 际 情况 要 陈旧 一 些 。 

讨论 同步 时 需要 阐明 的 一 个 重要 概念 牵涉 到 相对 性 。 计 算 机 关心 时 间 的 方式 与 人 类 不 
同 。 与 人 类 不 同 ， 系 统 只 有 在 决定 事件 的 相对 次 序 的 时 候 才 关心 时 间 。 因 此 ， 讨 论 时 间 的 时 
候 ， 认 识 到 有 两 种 根本 不 同 的 时 钟 是 很 重要 的 。 涉 及 “人 类 ”时 间 的 时 钟 叫 做 物理 时 钟 ， 只 
涉及 相对 时 间 和 保持 逻辑 一 致 性 的 时 钟 叫 做 逻辑 上 时钟。 我 们 现在 来 考察 两 种 时 钟 各 自 的 
问题 。 


10.2 物理 时 钟 


物理 时 钟 用 来 在 分 布 式 系统 中 传递 一 定 意义 上 的 “人 类 ”时 间 ， 它 们 是 计算 机 系统 的 手 
表 。“ 手 表 ” 服 务 是 一 种 时 间 服 务 ， 可 以 通过 集中 方式 或 分 布 方式 实现 。 它 有 责任 为 系统 内 
的 进程 和 服务 提供 其 种 程度 的 全 局 同步 时 间 。 全 局 时 间 的 实现 有 两 方面 需要 考虑 。 第 一 方面 
包括 如 何 获取 准确 的 物理 时 间 值 ， 这 将 在 10.2.1 节 中 加 以 讨论 。 第 二 个 方面 要 对 分 布 式 系 
统 中 的 物理 时 间 加 以 同步 ， 这 将 在 10.2.2 节 中 讨论 。 物 理 时 间 服 务 可 以 使 用 集中 式 的 算法 
来 实现 ， 这 将 在 10.2.3 节 中 讨论 ， 也 可 以 使 用 10.2.4 节 中 讨论 的 分 布 式 算法 实现 。 详 细 说 
明 10.1 描述 了 典型 的 计算 机 时 钟 在 单个 系统 中 是 如 何 实现 的 。 


10.2.1 获得 准确 的 物理 时 间 
为 了 获得 准确 的 物理 时 间 值 ， 要 求 物理 时 间 的 服务 器 从 世界 标准 时 间 协 调 (universal 
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time coordinator, UTC) 获取 当前 时 间 。UTC 是 当今 所 有 时 钟 基准 的 国际 标准 。UTC 的 两 个 来 
源 分 别 为 位 于 科罗拉多 Ft. Collins 的 WWV? 短 波 广 播 电 台 和 地 球 观测 卫星 (Geostationary Oper- 
ational Environmental Satejlites，GEOS)。 在 可 以 用 UTC 时 间 同 步 以 前 ， 时 间 服 务必 须 先 调整 数 
值 以 适应 传递 时 间 中 发 生 的 延迟 。 一 旦 时 间 值 的 报告 从 UTC 服务 器 处 返回 ， 它 立刻 就 过 时 
236, 了 ， 这 是 由 于 在 向 客户 传送 时 间 的 过 程 中 时 间 本 身 也 发 生 了 流逝 ， 如 图 10-1 所 示 。 必 需 的 
修正 值 因为 网 络 状 况 和 大 气 层 状况 的 变化 也 不 是 一 个 常数 。 所 以 ， 准 确 的 延迟 因而 也 开始 变 
化 ， 而 获得 真正 准确 时 间 的 过 程 就 变 得 复杂 了 。 可 以 给 计算 机 配备 一 个 时 间 提 供 者 (time 
provider) ， 一 个 能 够 直接 从 UTC 服务 器 获得 信息 并 作出 有 关 传 递 延 迟 的 适当 调整 的 商用 设 
备 。 有 的 系统 也 开始 使 用 UTC 的 俄 
罗斯 “党 兄弟 ”一 一 全 球 移动 通信 





客户 REINES 





系统 (global system for mobile com- 一 时间 请 求 
munications，GSM )。 就 像 生 活 中 的 ; 当前 时 间 
很 多 东西 一 样 ， 时 间 提 殿 者 的 质量 变化 的 网 络 延 刀 





也 就 是 时 间 的 准确 性 因 其 价格 而 变 Cl- 
化 。 一 般 来 说 ，“ 廉 价 ”的 时 间 提 
供 者 模型 要 花 次 数 千 美元 ， 而 绝 大 
多 数 准确 的 时 间 提供 者 模型 要 花费 数 万 美元 。 


10.2.2 物理 时 间 的 同步 


物理 时 间 服 务 的 第 二 个 方面 是 分 布 式 系统 中 时 间 的 同步 。 在 研究 分 布 式 系 统 中 时 钟 是 如 
何 形成 同步 并 保持 同步 之 前 ， 首 先 定义 同步 的 含义 是 很 重要 的 。 以 前 ， 我 们 已 经 知道 时 钟 受 
到 固有 的 偏 移 问题 的 困 沈 ， 这 是 不 可 避免 的 。 因 此 假定 分 布 式 系统 中 的 所 有 时 钟 总 是 精确 地 
同步 是 不 现实 的 ， 这 样 就 必须 允许 并 定义 一 个 可 接受 的 时 钟 偏 移 限 度 。 时 钟 偏 移 (clock 
skew) 定义 为 两 个 时 钟 之 间 因 为 偏 移 而 产生 的 时 间 上 的 差异 。 分 布 式 系统 物理 时 钟 服务 定义 
了 一 个 系统 中 所 允许 的 时 钟 偏 移 的 最 大 值 。 只 要 两 个 时 钟 之 间 的 差 值 小 于 最 大 时 钟 偏 移 量 ， 
就 可 以 认为 时 间 服 务 保持 了 同步 。 
那么 怎样 才能 确定 是 否 所 有 时 钟 之 间 的 差别 小 于 最 大 时 钟 偏 移 量 呢 ”为 了 分 析 任 意 两 个 
分 布 式 系统 内 的 单独 时 件 之 间 的 差 值 ， 每 个 成 员 都 必须 能 够 读 取 其 他 成 员 的 时 钟 值 。 如 地 点 
A 正在 读 取 地 点 B 的 时 钟 ， 为 了 获取 数值 ， 要 进行 如 下 步骤 的 操作 : 
1. 读 取 数 值 所 需要 的 信息 必须 经 网 络 传递 至 B。 
.必须 读 取 B 的 时 钟 值 。 
. B 的 时 钟 值 传递 回 地 点 Ao 
.调整 B 的 时 钟 值 以 反映 在 网 络 上 传输 所 花费 的 时 间 。 
.8B 的 时 钟 值 与 A 的 时 钟 值 相 比较 。 
第 4 步 很 难 准确 地 实现 。 网 络 上 传递 任何 信息 所 花费 的 时 间 不 断 地 变化 ， 这 可 能 是 由 于 
系统 和 网 络 的 负载 以 及 网 络 上 传递 信息 所 经 过 的 路 径 的 不 同 。 另 外 ， 如 果 网 络 上 发 生 错 误 ， 
(237) 信息 将 多 次 传递 ， 尝 试 的 次 数 也 是 增加 延迟 的 一 个 因素 。 


图 10-1 传递 时 间 时 网 络 的 延迟 


hn Ah U N 


O WWV 不 是 字母 缩写 而 是 电台 寻 呼 字母 。 
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详细 说 明 10.1 
计算 机 时 钟 的 实现 











以 下 是 六 个 计算 机 时 名 的 有 关 组 成 部 件 。 
1. BEAK, 

HEFER 

， 常 教条 存 器 。 

.国定 起 始 日 期 

HERH, 

， 滴 答 计 数 器 。 

我 们 首先 研究 一 下 前 三 Abate th Aik, AERA oh RH, 五 芮 琢 体 以 事先 预 
定 的 图 定 频率 振荡 。 这 些 晓 荡 由 计数 寄存 器 记录 。 顾 名 思 义 ， 常 数 寄存 器 存储 了 一 个 由 
湘 英 晶 体 的 振荡 频率 决定 的 并 依赖 于 它 的 一 个 常数 值 。 石 英 晶 体 每 拆 荡 一 次 ， 计 数 寄 存 
器 内 的 值 都 要 减 小 1。 当 计数 宠 看 器 内 的 数值 为 0 的 时 候 ， 戴 产生 一 个 中 断 并 返回 到 它 的 
初始 值 。 为 计数 寄存 器 选择 的 初始 值 是 基于 石英 振 功 的 ， 所 以 每 次 中 断 都 尽量 接近 一 秒 
的 第 60。 因 此 计数 寄存 器 产生 的 每 次 中 断 都 等 于 是 时 钟 的 一 次 滴答 。 

后 三 个 组 件 是 用 来 计算 实际 “人 类 ”时 间 的 。 每 个 系统 时 钟 的 功能 是 由 国定 起 始 日 
期 和 国定 起 始 时 间 决定 的 ， 在 UNIX 系统 中 ， ,国定 起 娩 日 贿 是 1970 年 月 [日 国定 起 娩 
时 间 是 0000。 如果 系统 没有 关于 内 存 的 电池 备份 ， 每 次 系统 重启 动 时 系统 管理 员 都 必须 
输入 当前 时 间 和 日 斯。 这 时 。 系 统计 算 从 国定 起 始 日 期 起 已 经 发 生 过 的 滴答 数 ， 并 把 此 
值 放 入 汉 答 计数 器 。 计 数 寄 覃 器 每 发 出 一 个 中 断 ， 滴 答 计 教 器 就 增加 1。 根 据 滴答 计 歼 器 
与 国定 起 始 日 期 与 国定 起 始 时 间 ， 系 统 就 能 计算 出 实际 的 “人 类 ”时 间 。 所 有 石英 并 不 
都 是 完全 相同 的 ， 所 选择 的 初始 值 也 可 能 不 像 人 们 所 希望 的 那样 精确 ， 计 算 机 时 钟 每 到 
一 阶段 就 需要 重新 闻 步 ， 以 保持 最 大 的 准确 度 。 特别 地 ， 闪 于 石英 推 落 的 计算 机 时 名 在 


Aaa A VN 











不 到 两 周 的 时 间 内 要 偏 移 1 秒 多 的 时 间 。 








10.2.3 ”集中 式 物理 时 间 服 务 


分 布 式 操作 系统 中 的 集中 式 物理 时 间 服 务 可 以 设计 成 两 种 工作 方式 ;基于 广播 的 ， 或 者 
是 请 求 驱动 的 。 从 我 们 学 过 的 集中 式 方法 来 看 ， 集 中 式 时 间 服 务 器 是 分 布 式 系统 中 故障 的 关 
键 点 ， 同 时 服务 器 周围 的 流量 会 增加 。 规 模 也 是 利用 集中 式 方法 的 一 个 限制 因素 ， 但 对 小 规 
模 的 分 布 式 系统 来 讲 ， 集 中 式 的 解决 方案 可 能 非常 成 功 。 我 们 现在 研究 这 两 种 工作 方式 及 其 
相应 的 问题 。 

基于 广播 的 方式 

在 基于 广播 的 集中 式 物 理 时 间 服 务实 现 方式 中 ， 时 间 服 务 阶段 性 地 向 分 布 式 系 统 中 的 成 
员 广 播 当前 时 间 。 可 以 采用 两 种 方法 接收 所 广播 的 时 间 。 第 一 种 方法 ， 各 成 员 考虑 了 网 络 传 
输 时 间 造 成 的 延迟 后 ， 与 接收 到 的 广播 时 间 相 比较 来 估算 它们 的 时 钟 ， 并 随 之 调整 自己 的 本 
地 时 钟 ， 但 它们 不 会 将 时 钟 设 定 为 更 早 的 时 间 。 这 种 方法 将 导致 以 下 两 种 情景 。 

4 如 果 给 定 成 员 的 时 钟 比 时 间 服 务 器 的 时 间 快 ， 成 员 将 放 慢 它 的 时 钟 以 使 得 它 逐 渐 接 近 
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正确 的 时 间 。 时 钟 不 能 拨 回 ， 因 为 反映 当前 时 间 的 事件 已 经 发 生 了 。 
4 如 果 成 员 的 时 钟 慢 于 时 间 服 务 器 的 时 间 ， 该 成 员 向 前 拨 动 时 钟 ， 如 图 10-2 Ara, EK 
的 处 理 方法 包括 逐渐 加 快 时 钟 。 


A 时 间 服 务 器 广播 当前 时 间 


REA 时 间 服 务 器 
当前 时 间 =720 











B. 各 位 置 更 新 时 韦 
位 置 A 
当前 时 间 =720 
调 蓝 后 当前 时 间 =750 
新 当前 时 间 =750 





图 10-2 向 前 调整 时 钟 


这 种 方法 中 ， 算 法 蜂 没 有 考虑 容错 性 。 如 果 时 间 服 务 器 的 消息 经 历 了 比 通 常 网 络 延迟 更 
长 的 时 间或 者 多 次 重 发 ， 成 员 将 不 会 意识 到 这 是 不 正确 的 。 相 反 ， 成 员 将 假定 消息 的 传输 看 
作 是 标准 的 一 次 传输 ， 床 经历 的 也 是 通常 的 网 络 延迟 ， 并 会 因此 调整 自己 的 时 钟 。 

基于 广播 的 集中 式 物理 时 钟 服 务 的 第 二 种 实现 方式 是 伯克利 (Berkeley) 算法 。 伯 克利 
算法 由 Gusella 和 Zatti 提出 [GuZa89]。 它 之 所 以 称 为 伯克利 算法 是 因为 它 用 于 Berkeley UNIX 
4.3 系统 中 实现 时 钟 的 同步 。 它 不 需要 时 间 服 务 器 去 访问 UTC。 与 第 一 种 方法 非常 相似 ， 集 
中 式 时 钟 服务 器 阶段 性 地 广播 当前 时 间 。 此 算法 包含 以 下 步 又 ， 如 图 10-3 所 示 。 

位 置 A BY (ELS 位 置 BB 
当前 时 间 =720 当前 时 间 =740 当前 时 间 =742 
调整 后 的 位 置 A=730 
调整 后 的 位 置 B=742 
平均 的 新 当前 的 时 间 
=737 























网 络 延 过 
=10 


4 












向 前 拨 钟 =7 


1. 当前 时 间 =740 

2. 我 的 当前 时 间 是 720 
3. 我 的 当前 时 间 是 742 
4. 向 前 调整 7 

5. 放 惕 适应 调整 5 


BOE 


图 10-3 物理 时 钟 同步 的 伯克利 算法 


1. 各 成 员 接收 到 广播 时 间 时 ， 将 各 自 的 当前 时 间 值 发 送 到 集中 式 时 间 服 务 器 。 

2. 时 间 服 务 器 根据 一 个 独立 地 反映 各 成 员 平均 网 络 延 迟 的 常数 值 调整 从 系统 成 员 那 里 
接收 到 的 时 间 消 息 ， 该 常数 值 是 事先 定义 好 的 。 

3. 调整 后 的 时 间 如 果 和 其 他 时 间 之 间 的 差 值 超 过 了 一 个 事先 定义 的 常数 ， 则 它 将 被 忽 
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略 不 计 。 将 忽略 的 时 间 值 认为 是 由 于 系统 中 的 故障 而 导致 的 ， 并 认为 是 不 准确 的 。 

4. 计算 剩 下 的 时 间 值 间 时 间 服 务 器 中 的 时 钟 值 的 平均 值 ， 并 认为 这 个 平均 值 是 当前 
时 间 。 

5. 时 间 服 务 器 计算 各 成 员 所 需要 的 调整 量 ， 并 将 此 调整 量 发 送 至 各 成 员 。 

6. 各 成 员 调整 各 自 的 时 钟 。 同 样 ， 走 得 快 的 时 钟 不 能 回 拨 ， 所 以 这 样 的 地 点 就 需要 拨 
慢 它 们 的 时 钟 。 

请 求 驱 动 方式 

请 求 驱动 的 方法 最 早 由 Cristian 提出 【Cri89. 。 在 集中 式 物 理 时 间 服 务 的 请 求 驱动 实现 
中 ， 每 个 成 员 向 时 间 服 务 器 发 出 一 个 要 求 当 前 时 间 的 请 求 。 算 法 明确 地 包含 以 下 步骤 ， 如 图 
10-4 所 示 。 
fA MIRZA 











当前 时 间 =737 

RCV=740 请 求 当前 时 间 
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调整 后 时 间 =750 





新 当前 时 间 =750 当前 时 间 =740 






图 10-4 请求 驱 动 的 物理 时 间 同 步 


1. 一 个 成 员 向 时 间 服 务 器 发 出 一 个 请 求 当 前 时 间 的 消息 。 

2. 时 间 服 务 器 返回 它 的 当前 时 间 值 。 

3. 成 员 计算 它 自己 的 时 钟 与 从 时 间 服 务 器 返回 的 时 间 之 间 的 差 值 ， 这 差 值 就 是 调整 时 
间 。 注 意 这 种 实现 方法 将 经 历 网 络 延迟 和 中 断 延 迟 。 中 断 延 迟 在 时 间 服 务 中 出 现 ， 包 含 了 两 
TE: 第 一 个 值 是 要 求 时 间 服 务 器 产生 一 个 中 断 的 平均 时 间 ， 表 示 到 达 了 一 个 消息 ; 第 二 个 
值 是 服务 器 响应 请 求 所 需要 的 时 间 。 

4. 如 果 这 个 调整 时 间 大 于 预先 定义 的 阐 值 ， 则 认为 它 是 不 准确 的 ， 它 的 产生 可 能 是 因 
为 额外 的 网 络 延迟 的 关系 。 不 准确 的 值 将 被 忽略 不 计 。 

5. 如 果 数 值 被 认为 是 准确 的 ， 成员 随 之 调整 自己 的 时 钟 。 同 样 ， 走 得 快 的 时 钟 不 能 回 
拨 ， 所 以 这 样 的 地 点 就 需要 拨 馒 它们 的 时 钟 。 


10.2.4 分 布 式 物理 时 间 服 务 


实现 物理 时 间 服 务 的 分 布 式 方法 要 求 每 个 位 置 的 成 员 以 预先 定义 的 时 间 间 隔 广播 各 自 的 
当前 时 间 。 因 为 时 钟 总 是 会 偏 移 ， 所 以 不 能 指望 广播 的 消息 会 精确 地 在 同一 时 间 发 生 。 其 一 
位 置 的 成 员 广 播 了 它 的 时 间 后 ， 就 启动 了 一 个 计时 器 ， 然 后 开始 收集 它 所 接收 到 的 时 间 消 
息 。 每 个 到 达 的 时 间 消 息 以 本 地 的 当前 时 间 标 记 ， 这 个 过 程 持续 到 计时 结束 为 止 。 计 时 结 
的 时 候 ， 每 个 消息 均 调整 为 反映 了 从 消息 源 到 本 地 的 网 络 延 迟 时 间 的 信息 。 此 时 成 员 以 以 下 
方式 中 的 一 种 来 计算 时 间 的 平均 值 。 

4 计算 所 有 消息 的 平均 值 。 此 平均 值 可 作为 当前 时 间 。 这 种 方法 会 导致 错误 的 结果 ， 因 

为 有 些 消息 可 能 因为 发 生 了 网 络 延 迟 或 重 发 而 不 准确 。 
4 将 每 个 值 与 错误 估计 阔 值 比较 。 错 误 估 计 阔 值 表 示 了 一 次 单一 传输 中 可 能 发 生 的 最 大 
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DEIR, EMH RMR ABR HRA. TRAP REN PHA, 
此 平均 值 可 作为 当前 时 间 ， 如 图 10-5 所 示 。 

4 抛弃 最 高 的 x 个 值 和 最 低 的 x 个 值 ， 然 后 取 平 均值 。 这 个 方法 有 点 像 为 体操 或 花样 滑 
冰 打 分 。 其 中 ， 最 高 的 m 个 值 和 最 低 的 m 个 值 被 认为 是 错误 的 并 被 抛弃 。 计 算 余下 
数值 的 平均 值 ， 此 平均 值 可 作为 当前 上 时间， 如 图 10-6 所 示 。 











当前 时 间 =740 当前 时 间 =740 

m=2 
调整 后 接收 到 的 值 调整 后 接收 到 的 值 
X= MH 
SEM DSS A 
时 间 一 4 平均 值 即 新 的 当前 
时 间 = 741 
X ARMM TINE 
图 10-5 ABRED E A106 抛弃 m 个 最 高 值 和 最 低 值 


时 钟 此 时 以 先前 讨论 的 方式 更 新 。 从 效率 方面 考虑 ， 有 些 实现 方法 对 广播 的 范围 作 了 限 
制 。 要 求 所 有 的 成 员 都 要 对 其 他 的 成 员 广 播 将 造成 很 大 的 流量 。 所 以 ， 一 种 修改 方案 采取 了 
要 求 成 员 只 向 其 相 邻 的 成 员 广 播 的 方法 。 相 邻 关系 要 涵盖 整个 系统 以 提供 一 种 全 局 的 服务 。 
242 | 这 种 修改 大 量 减少 了 流量 和 每 个 成 员 计 算 新 的 当前 时 间 所 需 接 收 的 数值 的 个 数 。 


和 10.3 网 络 时 间 协 议 


网 络 时 间 协 议 (Network Time Protocol, NTP) 第 3 版 的 有 关 信 息 可 以 在 RFC 1305 [Mil92 ] 
中 找到 。NTP 设计 成 在 大 型 分 布 式 系统 中 和 运行， 允许 系统 间 的 连接 从 慢 速 的 调制 解 调 器 直到 
可 能 的 最 快 的 连接 。 它 广泛 采用 于 Intemet。 早 在 1991 年 ， 在 北美 、 英 国 和 挪威 的 Internet 上 
已 经 有 大 约 30 个 一 级 NIP 服务 器 和 超过 2000 个 二 级 NTP 服务 器 [Mil91a]。 第 3 版 的 出 现 更 
好 地 容纳 了 当今 Intemet 所 使 用 的 高 速 网 络 。 它 向 下 兼容 旧版 本 的 NIP， 但 极力 推荐 新 版 本 
以 提供 更 高 的 准确 性 。 它 可 以 达到 1 到 50 微 秒 之 内 的 准确 性 。 尽 管 将 它 设计 成 在 Intemet 的 
IP 和 UDP 的 顶层 执行 ， 但 它 也 很 容易 被 其 他 网 络 传输 协议 所 采用 ， 以 臻 通常 认为 它 是 一 个 
独立 的 协议 。10.3.1 节 定义 了 NTP 的 体系 结构 。10.3.2 节 定 义 了 NTP 的 目标 。10.3.3 节 描 
述 了 NTP 服务 模式 。 最 后 ，10.3.4 节 描述 了 简单 网 络 时 间 协 议 (Simple Network Time Protocol, 
SNTP)。 


10.3.1 NTP 体系 结构 


为 了 适应 Intemet 上 巨大 的 数量 的 计算 机 系统 ，NTP 体系 结构 组 织 成 层次 状 的 树 型 结构 。 
这 个 结构 一 定 要 是 树 状 的 ， 所 以 没有 问 路 。 整 个 体系 结构 中 有 多 棵 树 ， 每 棵 树 的 父 结 点 都 是 
一 个 一 级 服务 器 。 一 级 服务 器 直接 与 UTC 时 间 源 相连 接 。NTP 的 目的 是 将 时 间 从 这 些 一 级 
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服务 器 传达 到 分 布 式 系统 中 的 二 级 成 员 。 被 二 级 服务 器 利用 来 获取 时 间 信 息 的 那个 特定 的 一 
级 服务 器 就 是 一 级 参考 服务 恬 。 一 级 服务 器 可 以 有 一 个 利用 可 靠 性 较 差 的 方法 获取 UTC 时 
间 的 后 备 服务 器 。 后 备 服务 问 是 出 于 容错 性 目的 而 设置 的 ， 只 有 当 一 级 服务 器 月 演 时 才 发 挥 
作用 。 二 级 服务 器 是 以 层次 方式 排列 的 。NTP 利用 电话 行业 的 术语 来 标注 不 同 的 层次 。 每 一 
层次 称 为 一 层 (straum), WWE 10-7 所 示 。 父 结 点 代表 处 于 第 1 层 的 一 级 服务 器 。 二 级 服务 
器 处 在 第 2 层 到 第 mn 层 。 第 2 层 的 成 员 直 接 与 一 级 服务 器 相连 接 。 第 3 层 的 成 员 与 第 2 层 的 
成 员 同 步 ， 依 此 类 推 。 成 员 的 层次 数字 越 小 ， 它 所 保持 的 时 间 就 越 准 确 ， 因 为 它 与 一 级 源头 
更 近 。 准 确 性 下 降 的 范围 与 网 络 路 径 和 本 地 时 钟 的 稳定 性 密切 相关 。 整 个 层次 结构 称 为 一 
闻 步 子 网 。 


一 级 服务 器 
2 ~ 
S A 只 所 bee? 
. ` | . 级 服 
: : 4% 
Bea —(16) © | 


图 10-7 NIP 体 系 结构 的 层次 


10.3.2 NTP 设计 目标 


以 下 是 NTP 的 四 个 主要 设计 目标 。 

1. 允许 准确 的 UTC 同步 。 

2. 即使 出 现 显著 的 连接 上 的 问题 也 要 保持 正常 运行 。 

3. 人 允许 保持 经 常 的 重新 同步 。 

4, 防止 恶意 的 或 意外 的 干扰 。 

为 了 达到 第 一 个 目标 ，NIP 必须 能 够 为 所 有 的 客户 提供 服务 ， 并 在 经 常 变 动 的 网 络 延 迟 
中 提供 准确 的 时 间 。 这 已 经 通过 采用 过 滤 数 据 的 统计 技术 实现 了 。 为 了 描述 过 滤 技 术 ， 我 们 
必须 首先 搞 清楚 NTP 所 传输 的 信息 。NTP 设计 为 提供 以 下 三 部 分 与 一 级 服务 器 有 关 的 信息 ， 
数据 的 格式 见 详 细 说 明 10-2。 


详细 说 明 10. 2 
NTP BERRO 


BORG ERED AH 32 1h, at AG a ae Oe 32 位 。64 位 的 数字 足以 表示 直到 

2036 年 的 时 间 。 这 种 表示 方 法 的 精确 度 为 300 MMA. 选择 这 种 格式 允许 多 种 不 ERA. 
AURARST RTA ERMBANADROLST RH), RAREN MI 
MIR | 








NP HARA 64 BLASER. MEHRI HYF 1900 年 1 月 1 日 0 时 。 
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“协议 中 的 所 有 数据 以 二 进 制 补 码 表 示 ， 以 定点 数 运算 。 可 以 指定 数据 为 整数 或 定点 
教 表示 方法 。 利 用 定点 数 的 表示 方法 时 ， 不 指定 精度 和 小 数 点 位 置 。 所 有 数位 从 左边 或 
者 高 位 开始 按照 从 小 到 大 的 次 序 排列 。 | 





1， 时 钟 偏 移 量 。 

2. 往返 的 延迟 。 

3. 离 差 值 。 

时 钟 偏 移 量 定义 为 两 个 时 钟 之 间 的 差 值 ， 尤 其 是 指 成 员 时 钟 为 了 与 一 级 参考 时 钟 同步 而 
必须 调整 的 值 。 往 返 的 延迟 使 得 成 员 能 够 在 指定 时 间 发 出 到 达 一 级 参考 时 钟 的 消息 。 离 差 值 
(dispersion) 指 本 地 时 钟 相 对 于 一 级 参考 时 钟 的 最 大 误差 值 ， 离 差 值 只 能 指定 为 正 值 。 同 时 ， 
这 个 信息 还 用 来 获得 时 间 并 指示 时 间 的 质量 和 准确 性 。 离 差 值 因子 数值 越 高 ， 数 据 就 越 不 可 
靠 ， 准 确 度 就 越 低 。 所 以 ，NTP 有 能 力 区 分 不 同时 钟 信息 之 间 的 准确 率 。 

所 采用 的 统计 技术 要 求 多 个 时 间 信 息 之 间 进 行 比较 。 时 钟 的 同步 需要 在 几 秒 钟 内 进行 多 
次 的 交换 。 识 别 时 钟 偏 移 和 在 一 毫秒 内 保持 时 间 需 要 超过 几 个 小 时 的 大 量 的 交换 量 。 所 以 ， 
统计 的 准确 性 与 获得 同步 所 需要 的 时 间 直 接 相关 并 且 依 赖 于 它 。 值 得 注意 的 是 每 一 次 交换 ， 
系统 和 网 络 的 性 能 是 相对 没有 影响 的 。 

第 二 个 目标 要 求 YIP 即使 出 现 显著 的 连接 上 的 问题 也 要 保持 正常 运行 。 为 了 达到 这 样 
的 目标 ，NTP 包含 了 砚 余 的 时 间 服 务 器 和 服务 器 间 的 元 余 路 径 。 此 外 ， 在 一 个 延长 的 时 段 内 
服务 器 仍 没 有 到 达 时 ， 人 允许 进行 简单 的 重新 配置 。 重 新 配置 包括 对 不 可 操作 或 发 生 错误 的 网 
络 部 分 进行 迁 回 的 网 络 路 由 。 所 选择 的 新 的 一 级 服务 器 必须 是 可 用 的 服务 器 中 最 近 的 一 个 。 
远近 程度 是 由 一 级 服务 器 与 二 级 服务 器 间 的 网 络 延 迟 决 定 的 ， 以 此 作为 同步 距离 的 参考 。 距 
离 相同 时 ， 新 的 一 级 服务 器 就 从 几 个 距离 相同 的 服务 器 中 随机 产生 。 如 果 某 子 网 内 所 有 的 一 
级 服务 器 都 月 演 了 ， 就 启用 后 备 服务 器 。 

第 三 个 目标 要 求 允许 保持 经 常 的 重新 同步 。 这 种 重新 同步 对 抵消 计算 机 中 的 偏 移 率 是 必 
要 的 。 人 允许 经 常 更 新 的 同时 ，NTP 也 能 够 扩展 它 的 服务 以 适应 在 大 规模 分 布 式 系统 中 潜在 的 
客户 和 服务 器 。 

最 后 一 个 目标 包含 防止 恶意 的 或 意外 的 干扰 ， 这 在 大 规模 分 布 式 系 统 中 很 重要 。 系 统 中 
的 成 员 越 多 ， 系 统 中 的 时 间 服 务 意 外 地 出 错 并 发 送 错误 信息 的 可 能 性 就 越 大 。 另 外 ， 系 统 还 
可 能 包含 恶意 的 时 间 服 务 。 为 了 适应 潜在 的 破坏 ， 所 有 的 时 间 服 务 都 采用 了 身份 认证 (在 第 
11 章 中 讨论 ) 并 返回 地 址 校 验 。 另 外 ， 可 以 采用 64 位 DES 密 钥 (在 第 11 章 中 讨论 )。 利 用 
身份 认证 和 加 密 技 术 以 后 ,会 遇 到 因为 安全 过 程 所 需 时 间 而 产生 的 额外 延迟 。 调 整 时 间 时 必 
须 考 虑 安全 时 间 延 迟 和 网 络 延 迟 的 因素 。 像 网 络 延 迟 一 样 ， 安 全 延迟 不 能 准确 地 估量 ， 这 样 
调整 后 的 时 钟 值 就 不 会 非常 准确 了 。 


10.3.3 NTP 同步 模式 


NIP 服务 器 可 以 以 三 种 方式 实现 同步 组 播 ，C/S 模式 和 对 称 模式 。 组 播 同 步 模 式 是 用 
在 高 速 局 域 网 上 的 ， 它 不 是 操作 上 最 准确 的 模式 ， 但 是 对 很 多 应 用 来 讲 经 证 明 已 经 是 足够 
的 。 组 播 (multicast) 是 发 给 一 部 分 用 户 的 网 络 消息 。 用 组 播 模式 操作 时 ， 时 间 服 务 器 会 周 
期 性 地 广播 当前 时 间 。 然 后 接收 者 利用 这 个 时 间 来 调整 它们 的 时 钟 ， 把 微小 的 网 络 延迟 时 间 
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考虑 进去 ， 如 10.2.3 节 中 描述 的 一 样 。 这 个 算法 类 似 于 基 寸 广播 的 集中 式 物理 时 钟 同步 的 
第 一 种 方法 。 网 络 不 支持 组 潘 的 时 候 ， 大 多 数 会 利用 C/S 模式 来 实现 操作 。 

C/S 模式 与 10.2.3 节 中 描述 的 请 求 驱动 的 方法 有 些 类 似 。 一 个 服务 器 接收 系统 中 成 员 发 
出 的 请 求 ， 每 一 个 请 求 接收 到 一 个 带 有 当前 时 间 的 响应 。 客 户 端 在 每 一 次 重启 动 和 此 后 的 周 
期 性 间隔 发 出 请 求 ， 间 隔 是 基于 客户 的 要 求 并 由 客户 决定 的 ， 服 务 器 不 保留 客户 的 状态 信 
息 。 整 个 机 制 呈 现 为 简单 的 远 过 程 调用 。 

后 一 个 操作 模式 是 对 称 模式 。 在 要 求 最 高 级 别 的 准确 度 时 使 用 这 种 模式 ， 它 包含 了 一 
对 交换 时 间 信 息 的 服务 器 。 信 息 的 交换 是 为 了 获得 两 个 服务 器 之 间 的 当前 等 待 信息 从 而 提高 
准确 度 。 这 种 方法 在 层次 数 相 差 不 超过 1 的 时 候 表 现 最 好 。 这 种 操作 模式 同 C/S 模式 相 比 更 
能 体现 对 等 计算 模式 。 

所 有 的 操作 模式 都 假定 下 层 的 传输 协议 (IP RA UDP) 处 理 包括 错误 探测 和 重 传 在 内 
的 差错 控制 。 详 细 说 明 10.3 显示 了 NIP 采用 的 帧 格式 。 所 有 的 操作 模式 在 数据 传送 到 时 钟 
更 新 过 程 之 前 要 执行 八 个 确认 测试 。 四 个 测试 用 来 确认 数据 ， 四 个 测试 用 来 确认 附加 在 数据 
上 的 信息 标题 。 详 细 说 明 10.4 给 出 了 所 执行 的 八 个 测试 的 列表 。 


详细 说 明 10.3 
NTP WER 





的 P HX. 加 为 UDP 是 下 的 一 个 客户 RAA 





NIP RRALT [mes] 申 









4 kih D 
中 精度 (Precision) . 
4 IER (Root Delay) 
es (Root Dispersion) 
2 参考 标识 竺 (Reference [ 
i SEHR (Reference Ti mp) o 
“4 原 发 时 间 锥 (Originate Timestamp) 
4 REHAB (Receive Timestamp) _ 
+*+ Ae th tt (Transmit Tapa) 
© iAH (Authenticator) - o | sE 
< RNR (leap) BRR, AAPEA, WO PLE RR, APARLE 
AMARAT REA mF AAMC 与 天 文 时 间 之 间 的 准确 协调 。 Hi prbae 
UP OREM: O 
$00: 无 警告 。 a so F 
: 401: 上 一 分 钟 包 全 61 秒 ， 
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610; 上 一 分 钟 包含 SIP 

4 11: BRERA: 系统 未 同步 。 | 

WAFERS, ae ee 用 来 指示 所 采用 的 NIP BRAT, HHR, 当 

前 的 版 本 号 是 3。 

“RULLWAAS ih MP 操作 所 末 用 简 坟 的 三 全 版 减 。_ 闪 有 有人 个 可 能 的 取信 
BAO, GETEN. HALPIAGRMARA, RAIERT I, 也 称 为 主动 
Oe RA a RAARANEBR. MAIRREPRA BRAD 

















| 是 NIP 在 进入 更 新 时 i 
性 ， 计算 偏 移 重 、 延 过 和 散布 需要 合法 的 教 据 。 后 四 个 测试 确保 标题 信息 的 有 效 性 。 这 
EMAAR 1084 (Gee) RAT AR ET AM | 

ARIER EK Rafe ERIC UA, HET RAR 
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消息 的 训 本 。 

2. 要 求 原 发 时 间 和 要 与 上 次 术 收 到 的 时 间 共 一 立 。 这 个 测试 保证 了 对 间 玫 信息 是 拉 
顺序 处 理 的 ， 而且 消 息 来 自 正确 的 -一 级 服务 器 。 

3. SRALSARS RATAREDE, SOMA MMSE ETE MRA 
没有 达到 Bee | : 
A SANNA GAR LRLRATLAMERZ A, 

5. RIOUNNUREARNECEATTN EAR. | 

6 要 求 对 等 的 时 钟 已 经 达到 同步 。 








a 保证 时 名 特 不 会 与 风衣 导 ‘ede 





10.3.4 简单 网 络 时 间 协 议 


简单 网 络 时 间 协 议 (SNIP) 是 NTP 的 一 个 修改 版 本 ， 在 不 要 求 很 高 的 性 能 时 可 采用 
SNIP。SNTP 可 以 在 所 有 NTP 指定 的 模式 中 操作 。 这 个 协议 实际 上 不 是 一 个 新 的 协议 ， 而 是 
怎样 简化 对 NTP 服务 器 访问 的 说 明 。 尽 管 是 简化 的 ， 它 仍然 可 以 在 微 秒 级 上 保持 准确 性 。 
有 关 简 单 网 络 时 间 协 议 (SNTP) 的 信息 可 以 在 RFC 1769 | Mil95] 中 找到 。 

这 个 协议 的 操作 包括 无 状态 的 远 过 程 调 用 。 它 严格 要 求 处 于 SNTP 客户 位 置 的 成 员 一 定 
要 处 在 子 网 中 的 最 高 层次 。SNTP 客户 不 能 用 来 与 其 他 NTP 或 者 SNTP 的 客户 同步 。 尽 管 操 
作 模 式 和 数据 格式 都 与 NIF 中 的 一 样 ，SNTP 服务 器 不 提供 容错 性 和 宛 余 性 能 的 实现 。 因 为 
缺少 元 余 性 ， 所 以 极力 推荐 SNTP 服务 器 作为 外 部 同步 源 的 连接 点 ， 例 如 一 个 可 靠 的 UTC 广 
播 时 钟 。 这 种 情况 下 ，SNTP 服务 器 将 处 于 第 1 尾 。 因 为 SNTP 不 允许 身份 验证 ， 服 务 器 必须 
为 客户 所 知 。 


10.4 人 逻辑 了 时钟 


因为 精确 地 校正 时 钟 很 难 ， 在 分 布 式 系 统 中 利用 物理 时 钟 惟 一 地 将 事件 排序 也 很 困难 。 
正 因为 如 此 ， 人 们 思考 是 否 可 以 用 别 的 方法 来 将 事件 排序 。 在 这 一 节 中 ， 我们 要 学 习 在 分 布 
式 系统 中 利用 轩 辑 时 钟 来 获得 一 个 惟一 的 事件 顺序 。 逻 辑 时 钟 的 实质 建立 在 Lamport 
[Lam78] 提出 的 超前 关系 上 ， 我 们 在 10.4.1 节 中 研究 这 种 关系 。10.4.2 节 研 究 这 种 关系 在 
逻辑 顺序 中 的 运用 。10.4.3 节 中 有 一 个 使 用 逻辑 时 钟 来 获得 总 体 排序 的 算法 。 


10.4.1 超前 关系 


Lamport [Lam78] 首先 描述 了 超前 关系 (Happen-Before Reiationship ) 。 如 果 事 件 a 在 事件 
4 之 前 发 生 ， 这 样 的 关系 表示 为 a > ge。 在 经 典 的 论文 中 ， 有 如 下 关于 事件 次 序 的 重要 观察 
结果 。 
4 如 果 两 个 事件 a 和 上 在 同一 个 进程 中 发 生 ， 它 们 之 间 的 次 序 是 它们 被 观察 到 的 次 序 
Mj a > bo 
MR a 向 5 发 送 了 一 个 消息 ,那么 a> 45。 也 就 是 说 ， 不 能 在 消息 发 送 前 接收 到 它 。 这 
个 关系 并 不 在 乎 事件 a Mb 是 在 何 处 发 生 的 ， 这 和 第 9 章 中 描述 的 偶然 关系 有 些 类 似 。 


250 


170 DA KREG: 原理 与 实践 


4 超前 关系 具有 传递 性 。 如 果 a 超前 于 b, b 超前 于 c, WA a 超前 于 co BRE, 
MRar>rbbh b>c, BAarc. 


必须 要 注意 到 这 个 关系 不 是 自 反 的 ， 
一 对 事件 都 是 并 发 的 ， 并 发 的 事件 没有 顺序 的 先后 。 详 细 说 明 10.5 








一 个 事件 不 能 超前 于 自身 。 任 何不 具备 超前 关系 的 
给 出 了 超前 关系 的 一 


例子 。 










详细 说 明 10.5 
la a 
作为 一 个 合子， 我 们 来 考虑 如 图 
同一 地 点 发 生 的 ， 根 据 超前 
息 的 是 事件 c， 根 据 超前 关系 ， 5 > c 
一 时 间 在 男 一 个 地 点 发 竺 。 因 为 事件 
8 MATERA 三 个 事件 3 

， es 








Ha, b ctd, FH aft 是 在 
个 地 虑 发 送 了 消息 。 接 受 这 个 消 
们 得 出 a> e 的 结论 。 最 后 ;事件 d 在 同 
不同 地 点 发 生 的， 和 事件 d 没有 关系 。 事 
| ec 之 间 没 有 次 序 上 的 关系 。 
























: 为 了 进一步 说 明 问题 1 amas 
PH AAT PRMMRAR. Ri AS ese 
codMBd>f, Mee Mus 因为 事件 。 和 /是 处 于 同一 个 进程 内 
的 ， 所 以 e>fo 要 注意 到 事件 a、 b, { en 是 与 事件 e 并 行 的 。 











10.4.2 ”逻辑 顺序 
逻辑 顺序 并 不 依赖 普通 的 时 钟 ， 普 通 的 时 钟 无 法 存在 于 分 布 式 系统 中 ; 也 不 依赖 于 同步 
的 物理 时 钟 ， 它 们 很 难 达 到 和 保持 。 超 前 关系 的 优点 是 它 不 依赖 于 物理 时 钟 ， 为 了 获得 逻辑 


RIŽ 分 布 式 同步 171 





顺序 ， 采 用 了 与 物理 时 钟 独立 的 时 间 惟 。 时 间 玲 可 以 由 简单 的 计数 器 实现 ， 只 要 它们 服从 超 
前 关系 。 每 个 事件 都 有 一 个 时 间 改 。 只 要 观察 到 的 现象 遵循 超前 关系 ， 就 认为 系统 内 的 时 钟 
是 准确 的 。 如 果 把 事件 a 的 时 间 惟 记 作 FT(a)， 利 用 逻辑 顺序 的 分 布 式 系统 必须 支持 以 下 的 
关系 。 

4 如 果 两 个 事件 a 和 在 同一 个 进程 中 发 生 。 它 们 之 间 的 次 序 就 是 它们 被 观察 到 的 次 

序 ， 也 就 是 T(a) > T(58)。 给 定 进程 的 时 钟 不 能 回 拨 。 
4 如 果 a 向 4 发送 了 一 个 消息 ， 那么 T(a) > T(5)。 也 就 是 说 ， 不 能 在 消息 发 送 前 接收 
到 它 。 

4 如 果 a 超前 于 Ob, b 超前 于 c，T(a) > T), T(b)> Tle), 那么 Ta) >T(c)。 

Lamport [Lam78] 提出 的 算法 融合 了 超前 关系 和 按照 以 下 两 条 规则 实现 的 逻辑 顺序 。 

1， 每 个 进程 在 每 两 个 连续 的 事件 之 间 增 加 时 钟 计数 器 的 计数 。 这 个 时 间 惟 反映 了 当前 
时 钟 的 数值 。 

2， 如 果 a Hb 发 送 一 个 消息 ， 这 个 消息 必须 包含 T(a)。 ee 
进程 必须 将 它 的 时 钟 设置 为 [ T(a) +1， 当 前 时 钟 ] 中 数值 较 大 的 一 个 。 也 就 是 说 ， 如 果 接 
收 者 的 时 钟 落后 了 ， 它 必须 向 前 调整 以 保持 超前 关系 。 

图 10-9 中 所 示 的 例子 利用 了 详细 说 明 10.5 中 所 举 的 相同 的 例子 ， 在 这 种 情况 下 ， 使 用 
计数 器 来 获得 逻辑 顺序 。 有 如 下 的 超前 关系 : a>b, b>c. cod, d>fMerfo BUF b 
携带 了 一 个 等 于 2 的 时 间 惟 。 所 以 根据 规则 2， 进 程 2 不 得 不 在 事件 e 发 生 的 时 候 调 整 时钟 。 
同样 ， 进 程 3 不 得 不 在 事件 /发 生 的 时 候 调 整 时 钟 以 保持 超前 关系 。 事 件 e 是 与 事件 ac、4 
c Hd 并 行 的 。 








进程 ! 进程 2 进程 3 
imal ee) f 
1 a a 、 

2 b z 5 7 





CHEERY IBF 
7 是 接收 a 的 事件 
得 个 事件 都 需 芭 计数 据 的 调整 以 保持 超前 关系 


图 10-9 使 用 计数 器 的 事件 的 逻辑 顺序 


利用 物理 时 钟 也 可 以 实现 轩 辑 顺序 。 一 般 来 讲 遵守 逻辑 顺序 的 第 一 条 规则 都 不 是 问题 ， 
计算 机 时 钟 在 两 个 事件 之 间 大 多 会 产生 若干 次 滴答 。 第 二 条 规则 也 相当 直观 。 如 果 到 达 的 信 
息 所 携带 的 时 间 惟 小 于 接收 者 的 当前 物理 时 钟 ， 那 么 物理 时 钟 必须 调整 至 此 时 间 稚 的 下 一 个 
时 间 单 位 。 必 须 牢 记 如 果 一 个 成 员 的 时 钟 比 正确 的 时 间 超 前 许多 ， 这 个 对 物理 时 钟 的 负面 影 
响 将 传播 到 整个 分 布 式 系统 中 。 除 了 这 个 可 能 需要 的 回 拨 以 外 ， 这 种 实现 方法 能 有 效 地 保持 
利用 物理 时 间 的 事件 之 间 的 逻辑 顺序 。 

图 10- 10 中 描述 了 一 个 利用 物理 时 钟 保持 逻辑 顺序 的 例子 。 又 是 同样 的 超前 关系 : 
b、b>c、c>d、d>f 和 e>/， 事 件 4 携带 了 一 个 等 于 20 的 物理 时 间 稚 。 所 以 根据 规则 2， 
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进程 2 不 得 不 在 事件 e 发 生 的 时 候 调整 物理 时 钟 为 21。 同 样 ， 进 程 3 不 得 不 在 事件 /发生 的 
时 候 调整 物理 时 钟 为 41 以 保持 超前 关系 。 事 件 。 是 与 事件 a、6、c Ad 并 行 的 。 








“是 接收 4 的 事件 
/是 接收 4 的 事件 


每 个 事件 都 需要 时 钟 的 调整 以 保持 超前 关系 
图 10-10 使 用 物理 时 钟 的 事件 的 逻辑 顺序 


10.4.3 带 有 逻辑 时 钟 的 总 体 排序 


我 们 已 经 看 过 10.4,2 中 的 例子 ， 超 前 关系 只 能 达到 部 分 排序 的 程度 。 这 种 关系 不 能 给 
出 并 发 事件 的 顺序 。 为 了 获得 总 体 排 序 ， 不 允许 两 个 事件 可 以 精确 地 同时 发 生 。 首 先 由 
Lamport [Lam78] 提出 的 一 个 直接 的 解决 方案 是 利用 在 时 间 惟 的 低位 部 分 填 人 进程 标识 号 。 
因为 每 个 进程 均 有 一 个 惟一 的 进程 号 ， 就 算 在 分 布 式 系统 中 有 两 个 成 员 分 别 在 同时 发 生 了 两 
个 事件 ， 它 们 也 持 有 独一无二 的 时 间 惟 。 例 如 ， 如 果 进 程 001 与 进程 002 都 在 时 间 32 发 生 
了 一 个 事件 ， 第 一 个 进程 的 事件 的 时 间 惟 是 32.001， 第 二 个 进程 的 事件 的 时 间 惟 是 32.002。 
现在 每 个 事件 就 能 够 拥有 自己 的 独一无二 的 时 间 戳 ， 系 统 也 就 可 以 获得 总 体 排 序 了 。 


10.5 小 结 


在 这 一 章 中 ， 我 们 把 注意 力 集中 在 获得 系统 范围 的 同步 所 产生 的 问题 及 其 解决 方法 上 。 
同步 有 两 个 基础 ， 反映“ 人 类 ”时 间 的 物理 时 钟 和 逻辑 时 钟 的 使 用 。 如 我 们 所 见 ， 物 理 时 钟 
的 同步 是 相当 困难 的 。 每 个 位 置 的 时 钟 都 会 发 生 偏 移 ， 由 此 导致 了 它 和 系统 中 其 他 时 钟 之 间 
的 时 钟 偏 移 。 无 论 是 采用 集中 式 的 还 是 分 布 式 的 方法 来 达到 同步 ， 利 用 消息 机 制 都 会 带 来 很 
多 复杂 的 问题 。 它 必须 适应 未 知 的 同时 也 是 不 可 预测 的 网 络 延 迟 。 另 外 ， 如 果 采 用 请 求 驱动 
的 方法 ， 还 要 考虑 到 未 知 的 中 其 延迟。 如 果 没 有 关于 从 服务 器 的 时 钟 上 读 取 时 间 值 之 后 已 经 
经 过 了 多 少时 间 的 精确 信息 ， 就 很 难 去 正确 地 调整 时 间 ， 所 以 很 多 情况 下 采用 了 平均 结果 的 
方法 。 其 实 ， 最 好 的 方法 利用 了 “容错 ”的 取 平 均值 和 抛弃 那些 看 上 去 不 合理 的 时 间 惟 。 我 
们 也 研究 了 一 个 广泛 应 用 于 同步 物理 时 钟 的 协议 一 一 NTP， 这 个 协议 也 允许 对 时 间 服 务 器 进 
行 身 份 认证 。 这 当然 是 一 个 优点 ， 但 是 它 可 能 也 加 入 了 另 一 个 不 可 知 的 时 间 因 素 ， 即 认证 消 
息 所 花费 的 时 间 。 拥 有 如 此 多 的 变量 ，NTP 还 能 够 在 300 微微 秒 内 同步 于 物理 时 钟 是 很 令 人 
吃惊 的 。 一 般 来 说 ， 这 个 精确 度 的 级 别 即使 对 最 复杂 的 应 用 也 足够 了 。 为 了 达到 这 样 的 精确 
度 ， 要 经 过 几 个 小 时 的 消息 和 回应 的 交换 。 要 快速 获得 准确 时 间 的 最 好 方法 是 直接 使 用 UTC 
服务 器 ， 但 这 将 带 来 大 量 的 财政 支出 。 

虽然 利用 物理 时 钟 能 够 成 功 地 实现 同步 ， 但 它 也 会 在 分 布 式 系 统 中 带 来 不 良 的 结果 ， 许 
多 应 用 要 求 的 是 总 体 排序 。 获 得 总 体 排序 的 最 好 也 是 最 常 采 用 的 方法 是 基于 Lamport 的 超前 
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关系 的 ， 并 且 这 个 方法 也 是 由 利用 因果 关系 的 逻辑 时 钟 引出 的 。 利 用 这 种 方法 与 物理 时 钟 和 
进程 ID 相 结合 的 时 间 惟 ， 就 能 获得 在 分 布 式 系统 中 的 总 体 排序 。 


10.6 参考 文献 


第 1 章 中 列 出 的 许多 参考 资料 都 可 以 提供 有 关 分 布 式 同步 的 大 量 信息 。 一 些 相当 传统 的 
有 关 这 一 章 信息 的 研究 论文 包括 [Bra80, Cri89, GuZa89, HSSD84, KoOc87, LaMe85, Li- 
Ka80, LuLy84, MaOw85, Mil88, Mil90, Mil9la, Mil9lb, Mil92, Mil95, Mit80, LAR Ric88]。 

以 下 提供 了 有 关 同 步 的 一 些 heme 上 的 重要 资源 的 链接 ，NTP 的 RFC 在 http: // 
www. cis. ohio-state. edu/rfc/rfcl769. txt, SNTP 的 RFC 同时 也 包括 NTP 的 声明 信息 ， 它 的 地 址 是 
http: //www.cis.ohio-state.edu/rfe/rfc1769.txt。 所 有 与 NTP 有 关 的 RFC 可 以 在 http: // 
www. cis. ohio-state .edu/cgi-bin/waisrfc. pl? NTP 找到 。 


习题 


10.1 列举 并 讨论 三 个 在 分 布 式 操作 系统 中 试图 与 物理 时 钟 同步 时 会 遇 到 的 困难 。 

10.2 列举 三 个 在 分 布 式 操作 系统 中 需要 全 局 时 间或 全 局 次 序 的 算法 。 

10.3 ”描述 三 种 可 能 发 生 的 难以 获得 和 准确 计算 物理 时 钟 值 的 事件 。 

10.4 ”在 一 个 分 布 式 系统 中 ， 绝 大 多 数 的 计算 机 每 毫秒 滴答 1200 次 ,但 是 有 一 台 计 算 
机 每 毫秒 滴答 1100 次 ,还 有 一 台 计 算 机 每 毫秒 滴答 1230 次 。 计 算 系统 中 每 分 钟 
的 最 大 偏 移 。 

10.5 一 个 计算 机 的 时 钟 是 11:07:34 (时 间 格 式 是 小 时 :分 钟 : 秒 )， 然 而 通知 它 当 前 时 
间 为 11:07:26， 计 算 它 对 自己 时 钟 的 调整 量 。 应 考虑 到 所 做 的 调整 必须 使 时 钟 在 
随后 4 秒 内 达到 同步 ， 请 描述 此 调整 方法 。 

10.6 命名 并 描述 可 以 加 入 分 布 式 时 钟 同步 算法 的 三 个 容错 特征 。 

10.7 使 用 分 布 式 时 间 服 务 器 的 时 候 ， 利 用 网 络 邻 居 有 什么 好 处 ?利用 这 种 方法 要 注意 
些 什么 ? 

10.8 为 什么 NTP 中 层次 数 较 高 的 成 员 的 准确 性 较 低 ? 

10.9 为 什么 一 个 二 级 成 员 与 一 个 一 级 参考 服务 器 采用 NTP 的 同步 时 钟 时 需要 多 次 时 间 
消息 的 交换 ? 

10.10 描述 在 使 用 NTP 作为 时 间 服 务 系统 中 促进 认证 机 制 的 使 用 的 三 个 场景 ， 并 描述 
使 用 认证 机 制 的 缺点 。 

10.11 对 以 下 每 一 个 NTP 的 时 间 惟 ， 描 述 其 在 分 布 式 系统 中 的 作用 和 优点 。 

A. 参考 时 间 惟 。 
B. MARKEE 
C. iit BX. 
D. 传输 时 间 改 。 

10.12 ”为 什么 不 要 求 一 个 SNTP 客户 与 另 一 个 SNTP 客户 进行 时 间 同 步 ? 

10.13 ”使 用 逻辑 时 钟 的 超前 关系 在 以 下 的 表格 中 填 和 人 校正 后 的 时 间 (如 需要 )， 并 标记 
出 所 有 的 超前 关系 以 及 所 有 的 并 发 事件 。 


255 


256 


174 DRRRUERKR: 原理 与 实践 




















进程 1 
时 间 校正 时 间 事件 
2 A 
4 B (向 进程 2 发 送 消息 ) 
6 C (从 进程 2 接收 消息 F) 
8 D (向 进程 3 发 送 消息 ) 
进程 2 
时 间 校正 时 间 事件 
3 E (从 进程 接收 消息 B) 
6 F (向 进程 1 发 送 消息 ) 
9 G (从 进程 3 接收 消息 
12 = H (向 进程 3 发 送 消息 ) 
_ 进深 3 
时 间 REET 事件 
4 I 
8 J (向 进程 2 发 送 消息 ) 
1 K (从 进程 2 接收 消息 H) 
16 = L (从 进程 1 接收 消息 D) 


10.144 ” 写 一 个 程序 来 实现 逻辑 顺序 的 超前 关系 。 利 用 习题 10.13 作为 一 个 示例 的 输入 
文件 。 要 求 程序 必须 能 够 计算 每 个 进程 的 校正 时 间 ， 并 且 标 记 出 所 有 的 超前 关 
L258 | 系 以 及 所 有 的 并 发 事件 。 


第 11 章 分 布 式 安全 


无 论 什么 时 候 讨论 分 布 式 计 算 ， 首 先 提出 的 问题 之 一 是 :“ 它 安全 吗 ?” 计 算 机 安全 经 常 
包含 两 个 部 分 : 身份 认证 和 访问 控制 。 身 份 认证 《authentication) 还 包含 对 合法 用 户 的 验证 
和 身份 鉴定 。 访 问 控制 (access control) 致力 于 防止 对 数据 文件 和 系统 资源 的 自 改 。 对 一 个 
独立 的 、 集 中 式 的 单 用 户 系统 ， 例 如 PC， 只 要 把 放置 计算 机 的 房间 和 磁盘 都 锁 起 来 就 能 完 
成 保卫 工作 。 这 样 ， 只 有 拥有 房间 和 磁盘 钥匙 的 用 户 才能 访问 计算 机 的 资源 和 文件 。 它 同时 
完成 了 身份 认证 和 访问 控制 。 安 全 的 程度 就 要 看 那 把 锁 住 计算 机 和 房间 的 铀 匙 了。 

对 一 个 多 用 户 的 独立 的 集中 式 系统 来 讲 ， 安 全 就 稍 复杂 一 些 了 。 在 这 种 情况 下 ， 身 份 认 
证 包含 对 合法 用 户 的 验证 和 身份 鉴定 ， 通 常 通过 某 种 形式 的 口令 操作 将 身份 鉴定 包含 在 一 
起 。 为 防止 对 文件 、 数 据 和 资源 进行 算 改 的 访问 控制 通常 通过 访问 列表 来 实现 ， 并 经 常 成 为 
操作 系统 中 的 一 部 分 。 

在 这 一 章 中 ， 同 以 前 -- 样 ， 身 份 认证 和 访问 控制 又 一 次 成 为 将 自己 的 系统 与 别 的 系统 通 
过 网 络 连接 时 首先 考虑 的 问题 。 尽 管 身 份 认 证 和 访问 控制 是 作为 操作 系统 操作 的 任务 来 考虑 
的 ， 但 是 分 布 式 访 问 控制 可 以 由 路 由 器 和 应 用 程序 来 执行 。 此 外 ， 既 然 是 通过 一 个 外 界 的 资 
源 〈 网 络 ) 来 实现 通信 的 ， 就 有 必要 分 别 使 用 加 密 和 数字 签名 来 保护 内 容 的 安全 ， 检 验 网 上 
信息 发 送 者 的 身份 。 

虽然 分 布 式 安 全 仍然 是 一 个 相当 活跃 的 研究 领域 ， 当 前 的 技术 足以 理解 安全 问题 的 基 
础 ， 并 且 现 在 有 很 多 针对 分 布 式 操作 系统 安全 问题 的 解决 方法 。 在 11.1 节 中 我 们 将 研究 多 
种 的 加 密 技 术 ， 包 括 它们 在 数字 签名 中 的 应 用 。 在 11.2 节 中 展示 了 两 种 通常 的 身份 认证 方 
法 。 在 11.3 节 中 介绍 在 分 布 式 系统 中 访问 控制 的 多 种 方法 。 这 一 章 中 讨论 的 方法 是 除了 集 
中 式 系统 中 必须 应 用 的 身份 认证 和 访问 控制 之 外 而 运用 的 方法 ， 后 者 已 在 第 8 章 中 讨论 过 其 
中 的 一 部 分 。 


11.1 加 密 和 数字 签名 


虽然 计算 机 用 户 偶尔 会 想到 用 加 密 的 方法 来 对 自己 独立 的 计算 机 系统 中 的 信息 进行 安全 
保护 ， 而 更 多 的 用 户 要 求 的 是 对 于 他 们 网 络 上 的 通信 进行 加 密 保护 。 加 密 (encryption) 使 用 
密 钥 将 数据 编码 ， 这 样 窃听 者 就 不 会 很 容易 地 读 出 信息 。 加 密 后 的 数据 称 为 密 文 (cipher- 
text) ， 而 加 密 前 的 信息 是 明文 (plaintext)。 从 密 文 转换 成 明文 的 过 程 称 为 解密 (decryption). 
图 11-1 描述 了 一 个 典型 的 加 密 过 程 。Alice 和 Bob 使 用 凯撒 和 码 (the Caesar Cipher) 对 通信 进行 
加 密 。 凯 撤 码 是 一 种 轮转 数据 的 简单 加 密 体 制 ， 在 此 例 中 为 向 前 轮转 两 个 字母 。 显 然 ， 这 不 
是 一 个 保险 的 加 密 方 法 ， 可 以 经 由 一 个 类 似 谷 物 箱 的 解码 环 (decoder ring) 进行 解码 。 最 通 
常 衡量 加 密 算 法 安全 性 的 方式 是 计算 安全 (computationally secure) 。 如 果 不 能 通过 现 有 的 资源 
进行 系统 的 分 析 来 破解 系统 的 话 ， 加 密 算 法 就 是 计算 安全 的 。 加 密 分 成 两 大 类 : LAMA 
公 钥 加 密 。 除 了 对 整体 信息 进行 加 密 ， 两 种 方法 都 支持 对 文件 进行 数字 签名 。11.1.1 节 以 
DES 为 例 研究 对 称 加 密 。11.1.2 节 以 RSA 为 例 研 究 非 对 称 加 密 。 两 个 例子 如 果 使 用 足够 长 
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的 密 铀 的 话 都 是 计算 安全 的 。 
[4 )) a | 一 i) ES i) )) Hello Bob! 2 
Alice Rx | 


明文 Bob 
图 11-1 Alice 和 Bob 使 用 加 密 


11.1.1 对 称 加 密 , 
对 称 加 密 (symmetric encryption) 指 的 是 加 密 和 解密 使 用 同样 密 钥 的 算法 。 如 ; 


E(p,k) = C&D(C,k) =p 

Kp, 

E= WERA 

D= 解 密 算法 

p= 明文 (RAE) 

k= DNS A 

C= 密 文 

既然 加 密 和 解密 数据 使 用 的 是 同样 的 密 钥 ， 这 个 密 钥 就 必须 秘密 保存 。 这 种 加 密 方法 也 
称 为 私 钥 加 密 或 是 传统 加 密 。 显 然 ， 使 用 这 种 系统 的 一 个 困难 之 处 是 传递 密 钥 1 解决 这 个 密 
钥 交 换 难 题 的 一 个 简单 的 方法 是 先 使 用 公 钥 加 密 的 方法 来 交换 密 钥 ， 然 后 再 使 用 私 钥 加 密 。 
详细 说 明 11.4 描述 了 一 个 交换 密 钥 的 公 钥 加 密 算 法 ， 即 Diffie-Hellman 密 钥 交 换算 法 。 它 非 
常 实 用 ， 因 为 典型 的 DES 加 密 差 不 多 可 以 达到 45 000kbps， 而 公 钥 加 密 一 般 为 20kbps。 我 们 
现在 来 研究 最 流行 的 私 钥 加 密 算 法 一 一 DES( 读 作 DEZ)， 它 是 在 1977 年 由 国家 标准 化 与 技 
术 研 究 所 (NIST)* 提 出 并 作为 美国 标准 的 【NIST77]。 其 他 的 私 钥 加 密 算法 包括 DEA 
[Lai92] 和 Skipjack (用 在 截 制 芯片 中 ) [NIST94a]。 

数据 加 密 标准 (Data Encryption Standard, DES) 

DES 在 1977 年 作为 一 个 标准 实现 ， 此 后 每 5 年 重新 审议 ， 通常 是 在 12 月 。 所 有 美国 的 
联邦 办 事 处 和 其 他 代表 它们 处 理 信息 的 组 织 都 必须 使 用 DES (用 在 未 分 类 的 文档 ) ， 它 也 普 
饥 应 用 于 非 政府 的 团体 中 。 它 建立 在 使 用 128 位 密 钥 的 IBM 的 LUCIFER 系统 上 。 一 般 来 讲 ， 
密 钥 的 数位 越 多 ， 系 统 就 越 安全 。DES 使 用 64 位 的 密 铜 ， 其 中 8 位 是 用 做 检 错 的 ， 所 以 实 
际 上 DES 有 56 位 的 密 钥 是 用 做 安全 目的 的 。 因 为 它 将 二 进 制 数据 每 64 位 作为 一 组 进行 加 
密 ， 所 以 也 称 为 分 组 加 密 。DES 的 安全 性 是 建立 在 密 钥 的 安全 上 的 ， 而 不 是 算法 的 安全 上 。 这 
种 安全 性 通过 密 钥 的 尺寸 得 以 加 强 ， 因 为 有 7 万 兆 兆 〈70 000 000 000 000 000) 可 能 的 密 钥 ， 所 
以 ， 获 得 密 钥 的 机 会 对 绝 大 多 数 分 布 式 系统 来 讲 足够 低 了 。 当 然 ， 随 着 个 人 电脑 平均 性 能 的 不 
断 增 长 ， 顺 序 寻 找 密 钥 从 而 破解 密 文 的 能 力也 在 相应 增长 。 加 密 算法 有 三 个 阶段 ， 如 图 11-2 所 
示 。 解 密 算 法 就 是 将 这 三 个 阶段 次 序 颠 倒 并 在 阶段 2 逆序 使 用 分 组 密 钥 (Kx 到 K )。 


日 ”从 前 称 为 国家 标准 化 局 ，NBS。 
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ex O O) eR SMR 


图 11-2 DES 的 三 个 阶段 


DES 第 一 阶段 :初始 置换 


DES 的 第 一 阶段 包含 一 次 64 位 分 组 的 置换 ， 将 每 个 分 组 内 部 的 位 序 打 乱 。 置 换 (permu- 
tation) 这 一 术语 有 严格 的 数学 意义 ， 仅 指 改 变 次 序 。 实 际 上 置换 是 由 一 个 表 实 现 的 (参见 
详细 说 明 11.1)。 现 在 64 位 的 数据 分 成 两 部 分 : L (AR) 和 R。( 右 段 )。 零 下 标 表 示 原 数 
据 段 。 以 后 每 经 过 一 一 次 DES 算 法 中 第 一 阶段 的 选 代 ， 下 标 就 增加 。 
详细 说 明 11.1 

DESEA 


DES 标准 所 使 用 的 初 置 换 的 表 喜 如 下 表 1L1 [NSIT] 所 示 。 所 以 ， 置换 后 的 第 1 
位 是 置换 前 的 第 58 位 ， 置换 后 的 第 2 位 是 秋 换 前 的 第 50 位 ， 








置换 后 数据 的 最 后 一 位 原来 
在 明文 中 是 第 7 位 。 
‘ Me 11-4 DES 初始 置换 [NIST77] . 
L ee i ~ 
3 和 oe a | w 18 Wo? 
6 o S SoM e ] 28 20. 12 a 
& _M Boe ee a a Sead 
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( 续 ) 
64 56 48 40 32 24 16 8 
57 3 4 3 25 0 9 ! 
59 51 43 35 27 19 11 3 
61 53 45 37 29 z 13 5 
63 55 41 E 31 z 15 7 








DES 第 二 阶段 : BH (HER 16) 

第 二 阶段 包含 一 个 使 用 密 钥 的 依靠 表 的 算法 。 这 个 动作 通常 称 为 数据 移 位 。 这 个 算法 要 
重复 16 次 ， 因 为 每 次 使 用 不 同 分 组 的 子 密 钥 所 以 每 次 移 位 的 动作 都 不 一 样 。 子 密 钥 由 另 一 
组 表 和 自己 的 移 位 算法 决定 。 每 次 迭代 后 ,，L (左边 ) MR (右边 ) 的 下 标 要 增加 以 表示 各 
个 阶段 ， 如 图 11-2 所 示 。 第 16 次 迭代 的 结果 称 为 预 输出 并 传递 给 第 三 阶段 。 确 切 的 表 和 各 
种 算法 见 [NIST77]。 

DES 第 三 阶段 : 逆 置 换 

DES 的 最 后 一 个 阶段 就 像 第 一 阶段 一 样 ， 包 含 一 次 64 位 分 组 的 置换 ， 改 变 每 个 分 组 内 
部 的 位 序 ， 但 是 它 使 用 的 是 不 同 的 表 。 实 际 的 置换 是 由 一 个 表 实 现 的 ( 见 详细 说 明 11.2)。 
这 次 置换 的 输出 就 是 密 文 。 























详细 说 明 11.2 
| DES ZRH 
表 11,2 所 示 的 是 DES BRET RH MANA [NSI], MA, FRENZ 1 
位 是 预 输出 中 的 第 40 位 ， 于 究 语 的 第 2 位 是 预 输 出 中 的 第 8 位;， 置 摘 后 密 文 的 最 后 一 位 
是 预 输 出 中 的 第 25 to, 
表 112 DESING [NIST771 
40 8 “ae 7 rE 4 64 32 
39 7 4 15 55 B 63 3h 
38 6 46 H S4 22 62 30 
37 5 45 13 53 21 6i 29 
36 4 44 2 52 20 的 28 
35 . 3 43 a H 51 19 59 27 
34 2 2 0 9 18 58 26 
33 t oA a oe 17 57 25 
= DES 


可 以 通过 三 重 DES 来 加 强 DES 的 安全 性 。 三 重 DES 利用 三 个 64 位 的 密 钥 。 数 据 首先 通 
过 使 用 第 一 个 密 钥 的 DES 三 个 阶段 加 密 产 生 C,， 然 后 Ci 通过 使 用 第 二 个 密 钥 的 DES 三 个 阶 
段 加 密 产 生 C,， 第 二 个 密 文 C, 最 后 再 通过 使 用 第 三 个 密 钥 的 DES 加 密 ， 如 图 11-3 所 示 。 


E(p,k,) =C, 
E(C,,k,) =C, 
E(C,,k,) =C, 


了 就 是 DES 加 密 算法 ，k 是 第 i 个 密 铜 ，p 是 原来 的 明文 ，Cs 是 最 后 的 密 文 。 





使 用 对 称 密 钥 加 密 的 数字 签名 

在 网 络 上 传输 数据 时 ， 有 两 个 加 
基本 方法 来 对 文件 进行 数字 签名 。 pa — ors fc 
我 们 现在 来 研究 第 一 个 方法 ， 即 使 





KAKAK, 


用 私 钥 加 密 的 数字 签名 。 数 字 签 名 k= kok, EB 
也 称 为 消息 摘要 ， 并 使 用 一 个 如 C LBAM EX 
LNIST93B] 所 描述 的 安全 hash K E 

数 。 这 个 hash 函数 称 为 摘要 函数 ， H13 =E DES 


典型 的 有 128 位 。 这 个 摘要 子 数 应 用 于 整个 文档 ， 产 生 一 个 依赖 于 消息 中 每 一 个 比特 信息 的 
值 。 利 用 共享 的 私 铀 可 以 有 两 种 方法 计算 摘要 。 最 简单 最 快捷 的 方法 计算 消息 的 hash 值 ， 
再 用 私 钥 加 密 消 息 ， 然 后 与 加 密 后 的 摘要 一 同 发 送 。 接 收 者 这 时 可 以 计算 消息 摘要 ， 加 密 并 
比较 相互 的 值 。 如 果 两 者 相符 ， 说 明文 档 的 内 容 没 有 被 改变 。 第 二 个 方法 是 将 密 钥 添加 在 消 
息 后 面 ， 然 后 计算 hash 值 ， 这 种 方法 的 结果 如 下 所 示 : 

计算 D (M，K)， 其 中 了 是 一 个 摘要 函数 ，M 是 消息 ，K 是 共享 的 私 钥 。 

文档 现在 可 以 公布 或 分 发 了 。 这 个 消息 摘要 另外 有 一 个 好 处 ， 就 是 防止 伪造 自身 的 摘要 
值 ， 因 为 第 三 方 不 知道 私 铀 ， 而 私 钥 对 计算 正确 的 摘要 值 是 必须 的 。 无 论 哪 种 方法 ， 要 证 实 
它 的 完整 性 ， 一 定 要 知道 密 铀 ， 而 且 任 何 伪 造 的 文档 都 会 马上 被 发 现 。 


11.1.2 非 对 称 加 密 


非 对 称 加 密 (Asymmetric Encryption) 包含 两 个 密 钥 一 一 一 个 公 钥 和 一 个 私 钥 ， 也 称 为 公 
钥 加 密 。 如 果 一 段 信息 由 公 钥 加密， 可 以 用 对 应 的 私 钥 以 如 下 的 方式 进行 解密 。 


E(p,k.)=C & D(C,k,) =p 


其 中 ， 

E= 加 密 算法 
D= 解 密 算 法 

p= 明文 ( 原 数据 ) 

ku = 24H 

k, = 私 钥 

C= 密 文 

如 果 一 段 信 息 由 私 钥 加 密 ， 可 以 用 对 应 的 公 钥 以 下 面 的 方式 进行 解密 。 
E(p,Ki)=C & D(C,k,) =p 
其 中 : 

E=- MEHA 

D = 解密 算法 

p= 明文 〈( 原 数据 ) 

k, =A% 

kx = 私 钥 
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C= FM 

不 能 用 加 密 消息 的 密 钥 对 其 进行 
解密 ， 如 图 11-4 所 示 。 此 外 ， 从 数 
学 的 角度 讲 ， ann 
也 很 难 获得 另外 一 个 。 私 钥 应 当 由 用 
户 秘密 地 保存 ， 这 像 它 的 名 字样。 
当然 ， 如 果 每 个 人 都 知道 了 这 个 私 


公 钢 加 密 外 

算法 f 
秘密 地 保存 ， 可 以 通过 公众 列表 服务 ©) M 公 铜 加密 "2e 
向 大 家 公布 ， 通 常 使 用 X.509 实现 mik 


CH 11.2.2 7 PHAR), SAMS 
的 思想 最 早 是 由 Diffie 和 Hellman 在 
1976 年 的 [DH76] Wit H, FRE 


9 O= 
密 钥 交换 的 方法 ， 详 细 说 明 11.4 中 ca nama | 
| j l" e Hello Bob! 
有 所 论述 。 公 钥 加 密 最 流行 的 形式 是 算法 f 
Bob i À 


RSA [RSA78]， 我 们 现在 就 来 进行 详 


te 





讨论 。 
组 SO KK AUK 是 Alice 的 私 铀 
K, 是 Alice HAG 
RSA Æ H Rivest, Shamir 和 Adle- 
man 在 1978 年 开发 的 一 个 专利 公 钥 图 114 公 钥 密码 学 


加 密 算 法 。 使 用 RSA 有 三 个 阶段 ， 阶 
段 1 确定 公 钥 和 私 钥 ; 阶段 2 对 一 个 消息 进行 加 密 ; 阶段 3 对 消息 进行 解密 。 接 下 来 将 描述 
这 三 个 阶段 ， 举 例 说 明 见 详细 说 明 11.3。 





详细 说 明 11. 3 
RSAS THAT 


第 一 阶段 ， o oe | | i 
L R Mice i P= =5, Q= le | o 








(使 用 KILLE E cona, n= ar 
0= =5* a+ 5 


Ja1*542 
5=2*2 +1 
ła 2*1+0)o 
5 使 用 扩展 约 隐 几 里 得 算法 特 DARK OH! (N) 的 线性 组 合 


























1=5-2%2 

=5-2* (7-1*5) | 
= ~-2*74+3*5 
= -2*743* (40-5*7) | 
=3*40-17*7 T o 
因此 1= -17*7 (Mod40) =23 (at), D= Bo | 
第 二 阶段 ， z | 
向 Alice RAN E M= 25. 

计算 C=M (ModN) = 25 (Mods5) = 20。 | 





第 三 阶段 : 

将 从 Alice 处 收 到 的 密 文 C = 20 解密 ， pamana (o= 23, N= 55). | 
HAC (Mod N) =M= 20 (Mod 55) =25 =M. | 

详细 说 明 11.4 fe | 

Diffie-Hellman 密 钥 交换 法 。 | 





Alice 和 Bob 可 能 使 用 这 各 方法 来 交换 密 钢 ， 他 们 必 RRA TEAD RA Se, Diffie | 
~ Hellman 密 钥 交换 法 ， 如 图 11-5 所 示 : 








图 11.5 Die Hellman EARR 
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.Alice 和 Bob 同意 一 个 公 开通 信 的 质数 和 整数 ao 
，Aliee 产生 一 个 随机 的 数值 : 2< x< =p- lo 
“Alice 计算 of (Modo) = A, 并 向 Bob 发 关 Ac 

. Bob j 生 一 个 随机 的 数值 17， ; 
hehe ed 





Ts 











RSA 阶段 1: 决定 公 钥 和 私 钥 。 

为 了 决定 公 钥 和 私 钥 ， 每 个 用 户 必 须 操作 以 下 六 步 。 

1. 选择 两 个 大 质数 PA Qo 

2. 计算 N = Px0Oo。 

3. HA F(N) =(P - 1(Q - Do 

4. 选择 e, 其 中 1 < =e < = n-1 并 且 GCD (e, F (N)) = 1 (GCD 为 最 大 公约 数 )。 
5. 计算 d， 其 中 ed = 1 (modf(n)) 使 用 扩展 的 欧 几 里 得 算法 )。 

6. 公开 d fin, 这些 值 组 成 了 公 钥 。 

RSA 阶段 2: 对 消息 加 密 。 

为 了 使 用 RSA 对 消息 M 进行 加 密 ， 其 中 1 < = M < = N - 1， 必须 进行 如 下 计算 。 


C=M (Mod N) 


其 中 c 是 密 文 。 

发 送 C。 

RSA 阶段 3: 对 密 文 解密 。 

为 了 使 用 RSA 对 密 文 C 进行 解密 ， 必 须 进 行 如 下 计算 。 


Cc’ (Mod N)=M 


其 中 M 是 原来 的 明文 。 

使 用 公 铀 加 密 的 数字 签名 

数字 签名 的 公 钥 加 密 方法 使 用 RSA。 在 此 方法 中 ， 创 建 者 使 用 它 的 私 钥 来 加 密 它 的 整个 
数据 文件 (RANER) 或 者 它 使 用 搞 要 函数 所 产生 的 文档 签名 。 相 对 于 私 钥 加 密 方法 ， 使 用 
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公 钥 加 密 的 主要 优点 是 它 不 存在 密 钥 分 发 的 问题 。 这 个 方法 假定 可 以 相信 发 布 公 钥 的 来 源 
(参见 11.3.1 节 ) ， 然 后 接收 者 可 以 使 用 公 钥 来 解密 签名 或 文档 来 验证 它 的 来 源 和 /或 内 容 。 
由 于 公 钥 密码 学 的 复杂 程度 (参见 图 11-4)， 只 有 正确 的 公 钥 才能 解密 消息 或 摘要 。 最 后 ， 
如 果 你 发 送 消息 给 已 经 知道 公 钥 的 某 人 ， 那 么 就 可 以 使 用 接收 者 的 公 钥 将 消息 或 摘要 加 密 ， 
这 样 只 有 接收 者 才能 使 用 他 们 的 私 钥 来 验证 信息 的 内 容 。 


11.2 身份 认证 


在 一 个 分 布 式 环境 中 提供 身份 认证 机 制 有 几 个 步骤 是 必须 的 。 第 一 步 是 认证 或 检验 用 户 
的 身份 。 完 成 这 一 步 有 三 个 基本 的 方法 [Sha77，WL92]。 首 先 ， 可 以 通过 用 户 所 知 的 一 些 
信息 如 口令 来 检验 用 户 的 身份 ， 这 是 最 普通 的 方法 ,但 不 是 最 安全 的 。 第 二 个 方法 使 用 用 户 
所 持 有 的 一 些 信息 如 密 钥 等 。 第 三 个 方法 包含 了 月 户 自身 的 一 些 信息 ， 比 如 用 户 的 指纹 或 是 
视网膜 模式 等 ， 这 是 最 安全 、 最 昂贵 的 方法 了 。 注 意 : 到 现在 为 止 ， 这些 方法 只 是 在 集中 式 
系统 中 能 很 好 地 工作 。 一 个 分 布 式 的 操作 系统 一 定 要 解决 好 以 下 问题 。 

1. 窃听 〈eavesdropping) ;我 们 怎么 来 防止 有 人 从 通信 线路 窃听 信息 ? 

2. $044 (multiple password management): 如 果 我 们 访问 一 个 多 机 系统 ， 是 不 是 每 
个 系统 都 要 保持 用 户 ID 和 口令 的 一 个 副本 呢 ? 每 个 存储 认证 信息 的 数据 库 都 有 可 能 泄漏 ， 
从 而 导致 系统 安全 的 骨 溃 。 此 外 ， 是 不 是 每 次 我 们 要 完成 一 项 工作 的 时 候 都 必须 出 示 口 令 呢 ? 

3. ER (replay): 认证 信息 在 网 上 传播 的 时 候 ， 即 便 它 是 加 密 的 ， 别 人 也 可 以 复制 它 ， 
然后 过 一 段 时 间 后 重新 发 送 ， 从 而 导致 不 适当 的 访问 。 

4.42% (trust): 认证 行为 是 单 向 的 还 是 用 户 也 有 能 力 去 验证 并 信任 将 会 合法 地 执行 服 
务 。 一 个 集中 式 系统 可 以 信 藉 其 自身 ， 而 分 布 式 系 统 则 一 定 要 找到 一 个 方法 去 相信 其 他 人 。 

通常 这 些 问题 的 解决 办 法 是 使 用 一 个 认证 证 书 管理 系统 。 认 证 证 书 是 分 布 式 系 统 中 由 计 
算 机 产生 的 ， 通 常 具有 时 间 肖 效 期 的 ， 经 过 认证 同意 后 可 以 方便 地 访问 多 种 资源 的 信息 包 。 
时 间 有 效 期 的 特性 预防 了 一 段 时 间 后 重演 的 发 生 。 可 以 经 由 一 个 时 间 戳 或 者 一 个 临时 标签 
(nonce) 来 实现 。 临 时 标签 是 一 个 每 次 通信 中 都 独一无二 的 一 个 随机 信 ， 所 以 没有 两 次 通信 
使 用 相同 的 临时 标签 ， 这 样 就 非常 容易 地 将 重演 检测 出 来 。 认 证 证 书 管理 有 两 个 基本 的 方 
法 。11.2.1 节 中 所 示 的 第 一 个 方法 利用 认证 证 书 列表 ， 此 表 包 含 了 从 可 信 的 认证 权威 处 得 到 
的 认证 信息 的 一 个 列表 ，X.509 就 是 一 个 例子 。 任 何 需 要 检验 身份 的 服务 必须 检查 列表 以 检 
验 客 户 的 可 靠 性 。11.2.2 节 中 所 示 的 第 二 个 方法 包含 了 一 个 集中 式 的 证 书 分 派 中 心 ， 客 户 在 
此 处 获得 所 需 服务 的 各 种 认证 信息 。 以 后 客户 使 用 服务 的 时 候 就 显示 这 个 服务 的 认证 信息 。 


11.2.1 证 书 表 


证 书 表 基于 如 11.1.2 节 所 示 的 公 钥 加 密 法 。 用 户 的 身份 标识 信息 成 为 一 个 认证 证 书 ， 
可 以 包括 在 证 书 表 中 。 认 证 部 门 检验 用 户 的 身份 就 是 指认 证 授权 和 检验 用 户 的 公 钥 。 图 11-6 
描述 了 一 个 服务 是 如 何 利用 证 书 表 的 ， 例 如 RPC. 

认证 证 书 是 通过 认证 部 门 的 数字 签名 来 认证 的 ， 数 字 签 名 参见 11.1 节 ， 可 以 有 若干 个 
认证 部 门 。 我 们 现在 以 X.509 为 例 ， 研 究 一 下 证 书 表 是 如 何 发 挥 作用 的 。 

X.509 

X.509 是 第 7 章 中 讨论 的 X.5S00 目录 服务 的 身份 认证 部 分 。 目 录 服 务 提供 了 证 书 表 的 位 
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1. 请 求 P。 
2. 收 到 ?、 
3. RIŽ P, (R, (RPC MSG)) ， 
4. ŠRP. 
5. KAP, 
6. 应 用 Rs 到 P, (R, (RPC MSG))_E , 
其 中 R、 是 服务 器 的 私 钥 , 得 到 R, (RPC MSG) 
7. NHP. BYR. (RPC MSG) 上 ， 得 到 RPC MSG 


图 11-6 用 做 安全 RPC 的 证 书 表 


置 ， 但 是 它 假 定 存 在 一 个 可 信赖 的 认证 部 门 来 创建 这 些 认证 证 书 。 认 证 证 书 是 由 发 布 人 签署 
的 《以 发 布 人 的 私 钥 加 密 )， 由 此 将 证 书 持 有 者 的 姓名 与 发 布 人 的 公 钥 联系 在 一 起 。 以 下 是 
X.509 认证 证 书 (版 本 1) 中 所 包含 的 元 素 。 

V: 版 本 号 。 版 本 号 将 X,509 的 几 个 后 继 版 本 区 分 开 来 ， 默 认 值 是 1988 年 的 版 本 。 

SN: 序列 号 。 序 列 号 是 发 行 认 证 证 书 的 部 门 发 布 的 一 个 独一无二 的 整数 值 ， 序 列 号 是 
和 认证 证 书 明确 联系 的 ， 就 像 社会 保险 号 与 美国 公民 或 移民 是 明确 联系 的 一 样 。 

Al: 算法 标识 符 。 算 法 标识 符 标 识 了 认证 部 门 签署 认证 证 书 时 所 采用 的 算法 ， 认 证 部 门 
用 它 的 私 钥 来 签署 每 一 份 证 书 。 

CA: 发 行者 或 认证 部 门 。 就 是 由 认证 部 门 来 创建 认证 证 书 的 。 

T$_[Al$ ; 有 效 期 。 提 供 了 有 效 的 最 初 和 最 迟 日 期 ， 就 像 信用 卡 上 的 日 期 一 样 。 

A: 正文 。 证 书 所 要 证 明 的 标识 。 

Ap: 公 钥 信息 。 为 证 书 所 标识 的 正文 提供 公 钥 和 算法 标识 符 。 

SZ: 认证 证 书 的 签名 包含 了 认证 的 其 他 各 个 部 分 。 签 名 是 其 他 数值 域 的 一 个 hash K 
数值 ， 并 使 用 认证 部 门 的 私 铀 进行 加 密 以 保证 整个 认证 证 书信 息 的 完整 性 。 如 果 有 人 使 用 认 
证 部 门 的 公 钥 将 hash 值 解密 ， 并 对 整个 证 书 计算 出 来 的 hash 值 进行 比较 ， 如 果 两 者 不 相符 
合 的 话 ， 则 说 明 这 个 证 书 的 内 容 被 非法 更 改 了 。 

任何 拥有 认证 部 门 公 钥 的 用 户 都 可 恢复 并 验证 证 书 表 内 每 一 个 认证 证 书 的 真实 性 。 
X.509 提供 了 三 个 使 用 证 书 表 的 身份 认证 过 程 ; 单 路 认证 ， 二 路 认证 和 三 路 认证 。 

单 路 认证 

单 路 认证 保护 消息 的 整体 性 与 原始 性 。 可 以 通过 用 户 使 用 自己 的 签名 (AA) 签署 的 时 
A. 、 临 时 标签 值 和 目标 位 置 标识 等 信息 来 实现 。 此 时 接收 者 可 以 将 信息 用 经 由 证 书 表 验 证 
的 创建 者 的 公 钥 进 行 “ 反 签名 ” ， 从 而 检验 信息 的 内 容 。 因 为 仅 限于 在 且 标 位 置 认证 ， 所 以 
就 称 为 单 路 认证 。 

二 路 认证 


BILE BAKES 


185 





二 路 认证 允许 接收 者 或 者 说 目标 也 可 以 由 发 送 者 或 创建 者 进行 验证 。 除 了 单 路 认证 的 过 
程 以 外 ， 目 标 也 向 创建 者 发 送 一 个 管 复 。 答 复 包含 了 新 的 时 间 稚 、 原 先 的 临时 标签 以 及 一 个 新 
的 临时 标签 。 答 复 使 用 创建 者 的 公 钥 来 签署 。 因 为 公 钥 加 密 法 中 只 有 对 应 的 私 铀 ， 所 以 说 只 有 
创建 者 的 私 钼 才能 将 答复 解 黎 。 此 外 ， 临 时 标签 一 定 要 是 原先 的 临时 标签 ， 否 则 将 不 能 确认 。 


三 路 认证 

当 目 标 和 创建 者 不 具备 同步 时 钟 
或 者 不 愿 相 信 时 钟 时 就 采用 三 路 认 
证 。 除 了 二 路 认证 的 过 程 之 外 ， 创 建 
者 然后 发 送 一 个 目标 答复 的 答复 ， 其 
中 包含 原 答复 中 的 新 的 临时 标签 ， 如 
图 11-7 所 示 。 一 旦 验证 了 临时 标签 值 
是 相符 合 的 ， 就 没有 必要 验证 对 间 融 了 。 

证 书 废除 

证 书 表 的 使 用 过 程 中 ， 存 在 一 个 
潜在 的 问题 是 认证 证 书 过 期 之 前 的 证 
书 废除 。 这 通过 保持 一 个 废除 列表 来 
得 以 实现 。 这 个 列表 是 与 证 书 表 是 一 
同 保持 的 ， 当 需要 确认 证 书 是 否 真实 
有 效 时 可 以 查询 该 表 。 这 与 过 期 信用 
卡 手册 相 类 似 ， 后 者 保持 了 一 个 在 有 
效 期 前 失效 的 信用 卡 的 列表 。 废 除 表 











一 全- m M, 

Alice 
M, E,,(T, N, B) 
M Eyr(T', N, N) 
M, E,(N) 


Ziwza 


使 用 Alice 的 私 钥 来 加 密 
使 用 Bob 的 私 钥 来 加 密 
HERR 

临时 标签 

Bob 的 标识 

Sat fam 

新 的 临时 标签 


Æ 11-7 =K X.50 认证 


还 保持 一 个 由 证 书 部 门 的 私 钥 签署 的 消息 摘要 以 保持 并 确保 列表 的 完整 性 。 


X.509 中 使 用 多 个 证 书 认 证 部 门 


另 一 个 潜在 的 问题 就 是 多 个 证 书 认证 部 门 的 存在 。 某 人 使 用 了 一 个 不 同 的 证 书 认 证 部 
门 ， 而 这 个 部 门 已 列 在 了 你 的 部 门 列表 中 ， 这 样 你 就 可 以 验证 他 的 身份 。 为 此 ， 必 须 用 你 的 
部 门 来 验证 其 他 的 部 门 的 身份 。 一 旦 完成 ， 你 就 拥有 了 其 他 部 门 的 公 钥 ,而 你 也 就 可 以 验证 
在 部 门 列表 中 的 用 户 的 身份 ， 如 图 11-8 所 示 。 


证 书 认证 部 门 1 


证 书 认证 部 门 2 


Alice 是 怎样 验证 Steven 的 公 钥 的 
L Alice 知道 证 书 认证 部 门 ! 


2. 评书 认证 部 门 1 知道 评书 认 证 部 门 2 


证 书 认 证 合 门 2 


Marc 
Denise 


证 书 认 证 部 门 N 


3. 证 书 认证 部 门 2 知道 证 书 认证 部 门 N 


4. 证 书 认证 部 门 N SUH Steven 


5. 结论 ， Mico 可 以 信赖 并 知道 Steyen HAA 


评书 认证 部 门 N 





图 11-8 X.509 中 的 连锁 证 书 认 证 部 门 


这 称 为 连锁 证 书 授权 ， 可 以 与 数学 上 的 传递 
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定律 来 进行 比较 。 如 果 Alice 知道 证 书 认证 部 门 1， 证 书 认证 部 门 1 知道 证 书 认证 部 门 2， 而 
证 书 认 证 部 门 2 知道 证 书 认证 部 门 N， 后 者 知道 Steven， 所 以 Alice 知道 Steven. 

认证 的 种 类 l 

最 后 ，X.509 提供 了 不 同 种 类 的 认证 。 每 一 种 都 通过 了 不 同 程度 的 验证 ， 所 以 反映 了 证 
书 表 中 授权 信息 不 同等 级 的 可 信和 度 。 

最 低 的 等 级 是 一 类 认证 。 在 这 一 类 认证 中 ， 和 使 用 者 提供 电子 邮件 地 址 ， 而 认证 部 门 向 这 
个 地 址 发 送 回应 ， 以 这 种 方式 来 检验 身份 。 最 高 的 等 级 是 四 类 认证 ， 它 要 求 使 用 者 以 物理 形 
式 出 现 ， 认 证 部 门 必须 进行 一 次 背景 的 核查 。X.509 证 书 可 以 被 安全 套 接 字 层 (SSL) 这 样 
的 协议 使 用 ， 详 细 说 明 11.5 进行 了 相关 描述 。 


详细 说 明 11.5 
安全 套 接 字 层 (SSL) 











,SSL 起 始 于 Netscape, RAIH A HEA TE Web 页 上 安全 地 通信 ， 随后 它 被 大 多 数 浏 | 
览 器 所 支持 。 RE, Wook LEST SSL. LRM LEA (Internet Engineering Task 
Fore, ETE) 正式 开发 了 S98L 标准 。 它 的 目标 是 确保 私密 性 、 整 体 性 和 真实 性 。 它 的 应 
用 从 原本 的 浏览 器 领域 ， 发 展 到 开发 公司 合作 工程 内 的 安全 传输 和 安全 通信 等 。SSL 的 使 
用 克 许 两 个 实体 以 某 种 (依赖 于 密 铀 的 长 度 ) 安全 方式 在 一 个 公众 网 络 上 通信 ， 并 且 不 
需要 很 多 的 已 有 代码 的 喜与 工 作 。 这 个 方法 很 可 能 比 寻 未 并 利用 一 一 条 专线 连接 的 方法 效 
FRE, URL. 
SSL OSs tiie BOWERS (authentication handshake), 而 及 要 完成 以 于 
的 任务 。 aS 
ee Ae Ae 
RAMEN 
a Wak ae 
ZRH. 
a TAMER X.S00LEME MMM, CHEM X3 中 的 连锁 证书 。 

实际 发 生 的 数据 通信 是 在 第 二 阶段 。 数 据 以 加 密 的 形式 发 送 ， 如 同 第 一 阶段 所 制定 
的 。 另 外 ， 每 一 个 数据 段 都 要 经 过 数字 签名 ， 通常 是 使 用 DES. 最 后 一 个 阶段 简单 包含 | 
了 执行 一 个 附加 的 握手 以 确保 双方 均 能 意识 到 连接 结束 了 。 Re, AMER, 一 般 来 说 ， 
SSL 使 用 一 个 40 位 的 密 钥 ， 因 为 现在 美国 的 贸易 禁令 禁止 更 长 的 密 钥 用 做 出 口 。 











r 
fen 
EF 

A 

5. 











11.2.2 集中 式 证 书 分 送 中 心 


一 个 集中 式 的 证 书 分 送 中 心 依赖 某 一 个 地 点 来 管理 所 分 送 的 全 部 认证 证 书 。 所 以 ,证 书 
分 送 中 心 就 成 为 分 布 式 系统 中 一 个 关键 的 因素 。 如 果 证 书 分 送 中 心 崩 省 或 受到 危害 ， 整 个 分 
布 式 系统 都 要 受到 影响 。 这 个 地 点 在 认证 数据 库 管理 器 中 保存 了 一 份 所 有 合法 用 户 的 私 铀 和 
系统 服务 的 拷贝 。 证 书 公 送 中 心 使 用 这 些 私 钥 向 每 个 想 利 用 服务 的 用 户 分 发 这 些 系统 和 服务 
证 书 ， 这 些 服务 证 书 必 须 以 客户 使 用 服务 的 形式 表现 出 来 。 对 每 一 个 用 户 和 每 一 个 服务 ， 都 
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有 一 个 独一无二 的 服务 证 书 。 这 些 服务 证 书 与 集中 式 系统 的 能 力 安全 概念 是 类 似 的 ， 所 以 ， 
一 个 用 户 可 能 有 若干 个 服务 证 书 ， 而 每 个 服务 证 书 都 必须 对 应 使 用 一 项 服务 。 服 务 证 书 只 在 
一 个 有 限 的 时 间 内 对 特定 的 服务 有 效 。 如 果 用 户 的 服务 证 书 过 期 了 ， 用 户 必须 使 用 用 户 的 系 
统 认 证 证 书 从 证 书 分 送 中 心 处 获得 一 个 新 的 服务 证 书 。 我 们 现在 通过 Kerberos v.5 来 研究 一 
个 集中 式 的 证 书 分 送 中 心 是 怎样 工作 的 。 

Kerberos v.5 

Kerberos 是 第 一 个 广泛 应 用 的 分 布 式 认证 协议 ,并 对 此 后 的 协议 产生 一 定 的 影响 ， 如 
SESAME 和 KryptoKnight， 现 在 可 以 从 ftp: //athena-dis.mit.edu/pub/kerberos 免费 得 到 ， 在 
[NeTs94] 中 有 所 描述 。 它 的 目标 是 提供 一 个 可 信 的 第 三 方 认证 系统 ， 通 过 使 用 第 三 方 ， 分 
布 式 系统 中 的 每 个 位 置 都 减轻 了 负担， 否则 它们 都 需要 保持 一 个 复杂 的 用 户 标识 和 口令 的 数 
据 库 。Kerberos 取而代之 地 只 保持 了 一 个 认证 信息 的 主 数据 库 ， 称 为 Kerberos 数据 库 管理 系 
统 (KDBM)。 可 能 有 几 个 Kerberos 的 密 钥 分 送 服务 来 辅助 KDBM， 它 们 包含 了 主 数 据 库 的 只 读 找 
贝 以 帮助 KDBM 来 缓解 瓶颈 的 问题 。Kerberos 密 钥 分 送 服务 也 允许 系统 在 KDBM 暂时 不 可 达 的 情 
况 下 仍然 发 挥 作用 。Kerheros 系统 包含 了 以 下 的 四 个 阶段 ， 将 在 详细 说 明 11.6 中 作 进 一 步 讲解 。 

阶段 0: 注册 Kerberos 

在 任何 一 个 用 户 建立 会 话 之 前 ， 首 先 必 须 离 线 (off-line) 地 在 Kerberos 密 钥 分 送 中 心 建 
立 用 户 的 标识 。 完 成 之 后 ， 用 户 的 ID 和 口令 在 Kerberos 数据 库 管 理 器 中 以 加 密 的 方式 保存 
着 。 这 样 就 可 认为 用 户 已 经 注册 了 ， 并 可 以 准备 利用 Kerberos 协议 的 网 络 服 务 。 


详细 说 明 11.6 
Kerberos 身份 认证 服务 v.5 











a: = 

ID, = 票据 授予 服务 的 四 

ID; =Æ Pi D 

ID, = 服务 器 的 ID 

Ni = 临时 标签 什 

Koa 客户 的 私 铜 ey 
Rs = 应 用 程序 服务 器 的 私 铀 

Ky = 隶 据 授予 服务 器 的 私 铀 

Ki = 客户 与 TGS 共享 的 密 钢 
Ks = 客户 与 服务 器 共享 的 密 钥 

T= RARE | 
T= RSE 

T,=- FRR 

T= Bane 

E (a, K) = 对 a 使 月 密 钥 进行 加 密 。 
阶段 如 图 11-9 所 示 ， 阶 段 2 如 图 11-10 所 示 ， 阶段 3 如 图 11-11 所 未。 
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oo 其中; 
T= 票据 
- Ms (ID... N) 
=. EN, . Ki. C). Ke) 
= ECD, 1D, Te Toys K). K) 





W119 Keabere MEEI W 


ok: 
M,=(ID, , N,, C, C,) 
C= EdD.. T.) K ) 


7 MEEN, K G), Ky) 
| ST E(D.. ID, . T,, To Ka), K) 





a aa ine 10 Kes 2 


ve Ta s E(D, T} Ka) 





图 n- i Reber 阶段 3 详解 





阶段 1: 获得 一 个 系统 票据 
Kerberos 认证 证 书 称 为 票据 。 第 一 阶段 可 以 获得 一 个 系统 票据 ， 它 用 来 从 第 二 阶段 中 的 


票据 授予 服务 (Ticket Granting Service, TGS) 处 获得 服务 票据 。 为 了 获得 系统 证 书 ， 必 须 在 


Kerberos 中 注册 (阶段 0) 。 获得 的 Kerberos 系统 票据 以 TGS 的 特别 私 钥 加 密 。 这 个 系统 票据 
中 有 客户 的 身份 信息 ， 如 下 所 示 : 


4 TCS 和 客户 间 使 用 的 暂时 会 话 密 钥 。 
4 客户 标识 。 

4 TGS 的 标识 。 

4 票据 过 期 时 间 。 

4 客户 的 网 络 地 址 。 
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票据 经 过 Kerberos 加 密 ， 所 以 只 和 
不 可 能 使 用 TGS AHAMI, RA Kerberos 和 TGS 才 知 道 密 钥 。 系 统 票据 与 TGS 的 标识 一 
发 送 给 客户 ， ” RIMINI Kees PRIS TCS MEPMAM AIRE, DARE 
户 发 送 给 Kerberos 的 临时 标签 值 。 如 果 临 时 标签 值 与 发 送 给 Kerberos 的 值 相符 合 ， 客 户 就 知 
道 系统 票据 是 合法 的 ， 并 且 是 最 新 的 。 

阶段 2， 获得 服务 票据 

为 了 获得 服务 票据 ， 客 户 向 TGS 发 送 一 个 经 过 会 话 密 钥 加 密 的 数据 包 ， 会 话 密 钥 是 由 
客户 与 TGS 共享 的 。 这 个 数据 包 内 包括 客户 名 称 、 网 络 地 址 、 临 时 标签 值 以 及 客户 想 使 用 
的 服务 的 名 称 。 另 外 ， 发 送 的 系统 票据 是 非 加 密 的 。 

当 TGS 使 用 密 钥 将 系统 票据 解密 后 ， 它 可 以 验证 系统 证 书 中 的 信息 是 否 与 接收 到 的 数 
据 包 中 的 信息 相符 合 。 如 果 符 合 ，TGS 就 可 以 确定 请 求 是 合法 的 。 认 定 为 合法 请 求 之 后 ， 
TOS 准备 向 客户 发 送 一 个 数据 包 ， 数 据 包 内 包括 了 使 用 服务 器 的 私 钥 加 密 的 服务 票据 (这 
样 ， 只 有 服务 器 才 可 以 验证 此 票据 ) 、 服 务 的 名 称 、 有 效 时 间 以 及 一 个 临时 标签 。 这 个 数据 
包 是 由 客户 与 服务 器 共享 的 会 话 密 钥 加 密 的 。 如 果 临 时 标签 值 相符 合 ， 客 户 就 知道 这 是 正确 
的 回应 。 我 们 现在 已 经 有 了 使 用 Kerberos 中 所 列 的 某 项 服务 的 密 钥 。 

阶段 3: 使 用 间接 服务 - 

现在 客户 有 了 上 服务 票据 ， 准 备 使 用 服务 。 服 务 票 据 允 许 此 项 服务 对 客户 的 标识 进行 身份 
认证 。 为 了 使 用 服务 ， 客 户 向 服务 方 发 送 一 个 数据 包 ， 包 中 包含 了 服务 票据 和 客户 的 标识 。 
我 们 知道 服务 票据 是 以 服务 器 的 私 钥 来 进行 加 密 的 ， 并 且 包含 了 客户 的 身份 标识 和 时 间 惟 。 如 果 
时 间 惟 没有 过 期 并 且 身 份 标识 也 符合 ， 那 么 客户 就 通过 了 身份 验证 ， 可 以 自由 地 使 用 服务 了 。 


11.3 访问 控制 (防火 墙 ) 


当 一 个 开放 的 分 布 式 系统 设计 成 允许 信息 在 所 有 相连 接 系统 间 自 由 流动 时 ， 分 布 式 操作 
系统 必须 提供 访问 控制 的 功能 ， 这 样 只 有 需要 共享 的 信息 才能 共享 。 此 外 ， 一 个 系统 所 需要 
的 ， 其 他 的 系统 未 必需 要 。 一 个 公司 也 许 会 采用 这 样 的 安全 策略 : “只 要 没有 明确 标明 是 允 
许 的 ， 那 就 不 允许 "。 同 时 ， 一 个 大 学 或 者 个 人 网 站 则 可 能 恰恰 相反 ， 安 全 策略 是 “只 要 没 
有 明令 禁止 ， 屠 就 是 允许 的 "。 虽 然 访 问 控 制 是 一 个 操作 系统 的 概念 ， 但 当今 的 分 布 式 操作 
系统 必须 依赖 硬件 的 协助 ， 通 常 采用 所 亩 的 防火 墙 技术 来 实现 访问 控制 。 

防火 墙 必须 避免 系统 受到 安全 方面 的 威胁 ， 并 且 防 止 所 有 的 安全 方面 的 威胁 通过 此 墙 而 
进入 到 它 所 保护 的 系统 内 。 同时， 防火 墙 决 不 能 影响 任何 遵循 组 织 中 的 安全 策略 的 行为 。 

防火 墙 一 般 归 入 以 下 两 个 种 类 ， 

1. 包 过 滤 网 关 。 

2. 代理 服务 。 

一 个 地 点 的 系统 可 能 经 常 同 时 采用 两 种 防火 墙 以 实现 所 要 求 的 访问 控制 。 我 们 分 别 来 研 
究 一 下 防火 墙 的 两 种 基本 种 类 ， 然 后 了 解 一 些 合并 两 种 方法 的 基本 防火 墙 体系 结构 。 


11.3.1 包 过 滤 网 关 


一 个 包 过 滤 网 关 防 火 墙 包括 了 一 个 安全 工程 师 ， 他 必须 明确 指出 什么 可 以 通过 防火 墙 ， 
包括 有 哪些 内 部 信息 是 可 以 流出 防火 墙 的 ， 以 及 允许 哪些 外 部 站 点 通过 防火 墙 。 另 外 ， 安 全 
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工程 师 可 以 配置 防火 墙 ， 以 指定 哪些 内 部 的 计算 机 服务 可 以 与 外 部 世界 共享 。 

包 过 滤 网 关 防 火 墙 一 般 在 连接 内 部 系统 与 外 部 世界 的 路 由 器 上 实现 。 一 般 的 路 由 器 都 可 
以 实现 包 过 滤 的 功能 ， 但 是 防火 墙 路 由 器 趋向 于 提供 更 友好 的 用 户 界面 ， 可 以 更 方便 地 对 基 
于 安全 的 过 滤 进 行 配置 。 就 像 遍 布 世 界 的 邮政 服务 需要 信封 上 的 地 址 一 样 ， 网 络 也 需要 信息 
带 有 自己 的 地 址 。 防 火 墙 检查 的 就 是 这 些 地 址 ， 在 信息 从 某 一 方向 通过 之 前 把 它们 与 自己 的 
列表 相 比 较 。 因 为 所 有 的 信息 都 必须 通过 执行 防火 墙 功 能 的 路 由 器 ， 所 以 所 有 的 信息 都 要 被 
防火 墙 所 检查 。 

包 过 滤 网 关 的 规则 可 能 如 表 11-3 所 示 。 

表 11-3 包 过 滤 网 关 规 则 
动作 目的 地 址 目的 接口 源 地 址 源 接口 


禁止 us. net Enemy. net 


同意 us. net Friend. net 





这 些 规则 禁止 了 所 有 从 enemy. net 到 us. net 的 信息 ， 无 论 连 接 的 是 网 络 的 哪 一 个 接口 。 
此 外 ， 这 些 规则 允许 所 有 从 Friend. net 到 us. net 任何 接口 的 信息 。 具 体 的 格式 因为 特定 的 路 
由 器 而 有 所 不 同 ， 并 且 依 赖 于 它 的 制造 商 。 无 论 是 哪个 制造 商 ， 设 置 系统 的 安全 工程 师 必须 
明确 指出 允许 的 和 禁止 的 所 有 事项 ， 这 并 不 是 容易 确定 的 。 有 些 服务 ， 像 UNIX X11 窗口 管 
理 器 ， 对 内 部 用 户 是 可 用 的 ， 然 而 如 果 有 内 部 的 用 户 可 以 使 用 XI1， 就 不 可 能 禁止 外 部 的 用 
户 使 用 了 。 一 个 未 经 授权 钓 X11 用 户 可 以 执行 内 部 用 户 的 屏幕 转 储 与 记录 击 键 信息 ， 这 是 
一 个 非常 严重 的 安全 隐患 。 另 外 ， 防 火 墙 上 留 有 的 漏洞 可 能 会 使 系统 的 安全 保护 工作 毁 于 
一 日 。 


11.3.2 代理 服务 


代理 服务 是 对 内 部 客户 提供 的 一 个 访问 外 部 世界 的 服务 。 提 供 这 项 服务 的 同时 ， 它 还 增 
加 了 一 些 安全 的 措施 。 代 理 服务 有 两 种 基本 的 类 型 . 
1. 应 用 层次 的 网 关 代 理 服务 
2. 电路 层次 的 网 关 代 理 服 务 
应 用 层次 的 网 关 防 火 吐 通过 重 写 所 有 主要 的 应 用 程序 来 提供 访问 控制 。 新 的 应 用 程序 位 
一 个 所 有 用 户 都 可 以 使 用 的 集中 式 主机 上 ， oe ALLL a TENERE ORR A 称 
为 设防 主机 (bastion hosts;， 代 表 关 键 的 安全 点 。 这 些 主机 经 常 是 双重 位 置 的 主机 (dual- 
homed) 或 者 是 位 于 多 个 网 络 的 主机 。 应 用 程序 运行 的 时 候 和 它们 修改 以 前 没什么 不 同 ， 只 
是 消除 了 安全 上 的 隐患 ， 特别 是 ， 新 的 应 用 程序 增加 了 一 个 非常 重要 的 小 特性 : 通过 前 面 讨 
论 过 的 方法 之 一 来 进行 身分 认证 。 应 用 网 关 防 火 墙 是 对 包 过 滤 网 关 出 色 的 补充 ,并 且 可 以 用 
来 重 写 像 X11 这 样 的 应 用 程序 。 
电路 层次 的 网 关 与 应 必 层 次 的 网 关 有 相似 之 处 ， 两 者 都 是 为 单个 应 用 程序 设计 的 。 不 同 
的 是 它们 对 用 户 是 透明 的 ， 特 别 是 外 部 的 用 户 可 以 通过 TCP 端口 与 网 络 连 接 。 在 电路 层次 
的 网 关中 ， 防 火 墙 提 供 了 TCP 的 端口 并 来 回 传递 数据 字 节 ， 就 好 像 一 段 线 路 一 样 。 通 过 这 
eee ea ON 同时 也 不 影响 应 用 程序 的 协议 。 
它们 是 在 一 个 较 低 的 层次 上 运行 的 ， 电 路 层次 的 网 关 需 要 修改 客户 以 获得 目的 地 
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址 ， 而 这 在 应 用 层次 的 网 关中 是 随时 可 用 的 。 修 改 后 的 客户 经 常 只 用 做 外 部 的 连接 ， 所 有 的 
过 滤 动 作 都 是 单独 对 源 地 址 和 目的 地 执行 的 ， 大 没有 特定 命令 的 附加 信息 。 

除了 传递 数据 字 节 ， 修 改 后 的 客户 和 电路 层次 的 网 关 保 存 了 一 份 所 传递 字 节 数量 的 日 
志 ， 日 志 中 还 有 TOCO 的 目的 地 。 如 果 一 个 已 知 的 站 点 有 安全 上 的 问题 ， 系 统管 理 员 可 以 使 
用 这 份 日 志 去 通知 系统 中 的 任何 不 幸 与 这 个 站 点 连接 的 成 员 。 


11.3.3 防火 墙 体系 结构 


我 们 现在 来 研究 三 个 融合 了 包 过 滤 防 火 墙 和 代理 服务 防火 墙 的 基本 防火 墙 体 系 结构 。 

设防 主机 体系 结构 

最 简单 的 体系 结构 是 设防 主机 体系 结构 ， 这 种 设计 专门 使 用 了 一 台 设 防 主 机 以 提供 代理 
服务 。 尽 管 主机 有 能 力 为 网 络 间 信 息 的 传递 提供 路 由 ， 但 并 不 推荐 使 用 主机 的 这 个 特性 ， 因 
为 可 能 因 混 用 它 而 经 常 导致 淹 没 防 火 墙 。 所 有 的 本 地 系统 被 认为 是 内 部 系统 ， 所 有 的 非 本 地 
系统 被 认为 是 外 部 系统 。 设 防 主机 是 一 个 双重 位 置 的 主机 ， 处 于 内 部 系统 和 外 部 系统 之 间 。 
它 不 直接 属于 任何 一 个 网 络 ， 而 是 作为 网 络 间 的 网 关 来 运作 。 所 有 的 内 部 系统 可 以 与 设防 主 
机 通信 ， 所 有 的 外 部 系统 也 可 以 与 同一 台 设防 主机 通信 。 内 外 系统 不 能 直接 相互 通信 ， 而 是 
将 主机 作为 各 自 的 代理 服务 器 来 实现 通信 ， 如 图 11-12 所 示 。 如 果 主 机 从 外 部 的 连接 处 收 到 
一 个 包 ， 包 上 的 地 址 是 内 部 地 址 ， 那 么 这 个 包 肯 定 具 有 区 诈 性 。 这 个 体系 结构 展现 了 代理 服 
务 所 有 的 弱点 ， 包 括 它 们 所 能 提供 的 服务 的 局 限 性 。 

过 滤 主 机 体系 结构 

过 滤 主 机 体系 结构 使 用 了 一 台 有 代理 服务 的 设防 主机 ， 还 有 一 个 路 由 咒 用 来 进行 筛选 并 提 
供 包 过 滤 能 力 。 与 先前 的 体系 结构 不 同 的 是 ,设防 主机 处 在 内 部 网 络 中 ， 如 图 11-13 所 示 。 














| 双重 位 置 的 





图 11-12 设防 主机 防火 墙 体系 结构 图 11-13 过 滤 主 机 防火 墙 体系 结构 
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过 滤 路 由 器 上 的 包 过 滤 能 力 将 所 有 人 允许 的 有 
内 部 目的 地 的 外 部 通信 和 痢 引 向 了 设防 主机 。 同 
时 ， 包 过 滤 可 以 设置 成 只 允许 设防 主机 可 以 访问 
外 部 。 如 果 设 防 主机 以 外 的 内 部 主机 都 被 禁止 访 
问 包 过 滤 路 由 器 ， 内 部 的 主机 将 被 迫使 用 设防 主 
机 的 代理 服务 来 访问 外 部 的 主机 。 这 样 ， 一 个 有 
严格 的 安全 要 求 的 网 站 将 会 禁止 内 部 的 主机 直接 
通过 包 过 滤 防 火 墙 访问 外 部 的 网 络 。 

过 滤 子 网 体系 结构 

三 种 防火 墙 体系 结构 中 最 安全 的 是 过 滤 子 网 
体系 结构 。 这 种 体系 结构 包括 两 个 包 过 滤 防 火 墙 
和 一 个 代理 服务 防火 墙 。 代 理 服务 防火 墙 或 者 设 
防 主机 是 和 它 自 己 的 网 络 相 连 的 ， 它 自己 的 网 络 
位 于 两 个 包 过 滤 防 火 墙 之 间 。 一 个 包 过 滤 防 火 墙 
将 设防 主机 的 子 网 与 外 部 网 络 相 连接 ， 另 一 个 包 
过 滤 防 火 墙 将 设防 主机 的 子 网 与 内 部 网 络 相连 
接 ， 如 图 11-14 所 示 。 

能 访问 外 部 网 络 的 子 网 称 为 过 滤 子 网 。 因 为 
对 于 大 多 数 本 地 区 域 的 网 络 ， 所 有 网 络 上 的 主机 都 可 能 “ 偷 宽 ” 或 者 看 到 所 有 网 络 上 的 信息 
交流 ， 所 以 这 种 体系 结构 的 最 大 好 处 是 在 过 滤 子 网 上 减少 了 只 在 内 部 流通 的 信息 。 这 样 ， 一 
个 人 侵 者 必须 通过 外 部 包 过 滤 路 由 器 ， 破 坏 设 防 主机 ， 再 通过 内 部 包 过 让 路 由 器 才能 破坏 访 
问 控制 。 


11.4 小 结 


这 一 章 讨 论 了 已 有 的 、 安 全 的 独立 系统 在 向 网 络 连接 时 增加 安全 措施 的 方法 。 与 集中 式 
的 系统 一 样 ， 分 布 式 的 安全 包括 了 身份 认证 和 访问 控制 ， 另 外 还 需要 考虑 加 密 和 数字 签名 的 
使 用 。 当 决定 使 用 什么 方法 的 时 候 ， 必 须 考虑 把 要 保护 的 信息 的 价值 放 在 首位 ， 还 必须 考虑 
信息 的 时 间 范 围 。 例 如 ，Microsoft™ 多半 不 会 再 担心 什么 人 会 知道 他 们 将 在 何 时 发 布 Win- 
dows95“， 因 为 它 已 经 发 布 了 。 然 而 ， 当 这 个 产品 正在 首次 酝酿 、 计 划 、 开 发 的 过 程 中 ， 这 
个 信息 无 疑 是 非常 重要 的 ， 必 须 非常 秘密 地 保护 起 来 。 因 此 ， 网 络 上 一 个 给 定 的 系统 可 能 只 
使 用 包 过 滤 网 关 ， 而 其 他 系统 则 同时 选择 了 使 用 代理 服务 器 。 同 样 ， 不 是 所 有 的 系统 都 如 此 
复杂 和 昂贵 以 致 要 使 用 四 类 证 书 授权 。 然 而 像 Equifax 这 样 的 公司 是 用 来 维护 美国 公民 的 信 
用 卡 数 据 库 的 ， 它 就 选择 了 使 用 一 个 隔离 的 网 络 ， 它 认为 即使 使 用 了 当前 所 有 的 分 布 式 安全 
技术 ， 任 何 与 外 界 网 络 的 连接 仍然 都 是 非常 冒险 的 。 总 之 ， 就 像 在 独立 的 计算 机 上 使 用 的 标 
准 操作 系统 一 样 ， 有 可 能 达到 更 高 层次 的 安全 性 ， 但 仍 不 具有 100% 的 保证 。 


11.5 参考 文献 


以 下 的 参考 文献 可 以 提供 有 关 分 布 式 安全 的 更 多 的 信息 ; ([Bra95, Car95, ChBe94, 
ChZw95, KPS95, McC98, Pf197, Pow95, Sta95 以 及 Wil94]。 一 些 相当 经 典 的 有 关 这 一 章 信 息 








图 11-14 ”过滤 子 网 防火 墙 体 系 结构 
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的 研究 论文 包括 [| ABCLMN98, AbPo86, ADFS98, AGS83, AJP9S, And94, BAN90, BBF83, 
BFMV84, ClHo94, DH76, DESA81, DoMc98, Erick93a, Hel78, Klu94, LABW94, Lai92， 
Nes83, NeTs94, NIST77, NIST93B, NIST94a, NIST94b, Opp97, Opp98, PaSh98, RSA78, 
RuGe98, Schn98, Sim92, Sha77, THPSW98 和 WoLa921。 

以 下 提供 了 有 关 安 全 问题 的 一 些 intemet 上 的 重要 资源 的 起 始 链接 。 一 个 有 关 安 全 性 的 
列表 链接 可 以 在 http: //www. semper. org/sirene/outsideworld/security . html 找到 。 这 个 网 站 包括 了 
标准 和 协议 的 链接 ， 以 及 很 多 包含 其 他 资源 的 网 站 。 通 过 向 rsaref @ rsa.com 发 送 邮件 ， 可 以 
获得 有 关 如 何 得 到 RSAREF 的 信息 。RSAREF 是 一 个 免费 (只 对 美国 和 加 拿 大 公民 ) 的 教育 
工具 ， 用 C 写成 ， 可 以 执行 RSA 的 加 密 和 密 钥 生成 、DES、Diffie-Hellman 密 钥 协定 、 三 重 
DES 等 一 系列 特性 。Kerberos 所 需 的 备注 1510 文档 可 以 在 ftp: //ftp.isi.edu/innotes/rfe1510. txt 
RA, AREF (免费 地 ) 得 到 Kerberos 的 信息 可 以 在 http: //web. mit.edu/kerberos/www/krb5- 
1.0/announce.html 找到 。 一 个 有 关 Kerberos 的 论文 和 文档 的 列表 可 以 在 http: //nii.isi.edu/info/ 
kerberos/documentation . html 找到 。 可 以 在 http: //www.esat.kuleuven. ac. be/ ~ vdwauver/sesame.h- 
tml 找到 有 关 获 得 Sesame 的 信息 及 其 源 程序 的 信息 ， 这 个 程序 是 一 个 建立 在 Kerberos 上 并 扩 
展 了 Kerberos 的 分 布 式 访问 控制 的 程序 。 一 个 带 有 SSL 的 参考 资料 指针 的 SSL 免费 版 本 则 位 
于 http: //psych.psy.uq.oz.au/ ~ ftp/Crypto/。 在 http: 1/www.ssh.fi/tech/crypto/ 有 一 系列 与 密码 
学 有 关 的 算法 和 标准 的 链接 。 


习题 


11.1 对 分 布 式 系 统 夹 讲 安全 性 还 要 考虑 嘱 些 方面 ”有 可 能 提供 与 独立 的 集中 式 系统 同 
等 程度 的 安全 吗 ? 
11.2 讨论 对 称 加 密 与 非 对 称 密 钥 加 密 的 优 缺 点 。 
11.3 使 用 11.1 节 中 列 出 的 RSA 公 钥 加 密 算 法 ， 令 P=7，Q=11，e=4。 
a. 计算 D 的 值 。 
b. 公 钥 是 怎样 的 ? 
c. 如 果 消 息 是 M= 17， 发 送 的 加 密 后 的 信息 是 怎样 的 ? 
d. 使 用 公 钥 解密 以 验证 消息 。 
e. 计算 详细 说 明 11.4 中 的 共享 密 钥 。 
11.4 写 一 个 程序 来 实现 详细 说 明 11.4 中 的 Diffie-Hellman 密 钥 交换 算法 。 
选项 1: 允许 Alice 和 Bob 使 用 同样 的 终端 来 交换 密 钥 ， 人 允许 程序 选择 随机 数 。 
选项 2: 假定 用 户 是 Alice， 程 序 是 Bob， 人 允许 Alice 和 Bob 交换 数值 信息 。 
选项 3: 使 用 第 4 章 中 学 到 的 IPC 机 制 ， 允 许 两 个 在 不 同 计算 机 上 的 用 户 交 换 密 
铀 和 数值 信息 。 
选项 4: 允许 月 户 选择 以 上 三 个 选项 中 的 任何 一 个 。 
11.5 讨论 X.509 中 单 路 、 两 路 、 三 路 身份 认证 的 相对 优点 。 
11.6 讨论 以 下 X.509 身份 认证 过 程 的 可 能 用 途 。 
a. 单 路 身份 认证 
b. 二 路 身份 认证 
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11.7 描述 一 个 SSL 第 一 阶段 中 消息 交换 的 可 用 算法 ， 使 用 四 个 密 钥 并 允许 对 对 方 的 身 
份 标识 进行 验证 (同一 给 定 用 户 的 公 钥 和 私 钥 分 别 作为 两 个 密 钥 )。 

11.8 讨论 分 布 式 身份 认证 中 使 用 证 书 表 和 证 书 分 送 中 心 的 相对 优 缺 点 。 

11.9 Kerberos 中 有 若干 个 密 钥 分 送 服务 有 什么 优点 ? 

11.10 ”在 集中 式 系 统 中 ， 经 常 使 用 一 个 访问 矩阵 ， 和 矩阵 的 行 表示 用 户 GRAPE), 4 
阵 的 列表 示 次 源 ( 拥 有 不 同 程 度 的 颗粒 度 定 义 )。 和 矩阵 中 的 信息 定义 了 用 户 是 否 
有 资格 使 用 此 项 资源 ,或 者 在 多 大 程度 上 有 资格 使 用 。 对 以 下 每 个 选项 ， 描 述 
一 下 如 果 这 种 矩阵 用 在 分 布 式 系统 中 会 产生 什么 问题 。 

a. 在 一 个 单独 的 集中 式 服 务 器 上 实现 。 
b. 在 有 多 个 这 样 的 矩阵 拷贝 的 分 布 式 系统 中 实现 Ger: 考虑 第 7 章 的 相关 
内 容 )。 

11.11 一 些 节 点 喜欢 使 用 多 个 设防 主机 。 讨 论 这 种 方法 的 优点 。 

11.12 本 章 中 所 述 的 三 种 防火 墙 体系 结构 中 ， 最 安全 的 是 哪 一 个 ? 为 什么 ? 

11.13 一 般 都 认为 在 筛选 后 的 子 网 防火 墙 体系 结构 中 使 用 多 个 外 部 路 由 器 是 没有 问题 
的 ， 但 是 使 用 多 个 内 部 路 由 器 则 被 认为 冒 着 极 大 的 安全 风险 。 为 什么 ? 

11.14 使 用 电缆 调制 解 调 器 提供 家 庭 访 问 的 体系 结构 称 为 电缆 调制 解 调 器 体系 结构 ， 
其 中 单条 电缆 在 每 个 家 庭 内 进出 (非常 像 珍珠 项 链 )， 同 邻居 一 起 连 成 了 一 个 虚 
拟 的 局 域 网 。 

a. 这 种 实现 方式 将 出 现 安 全 上 的 什么 基本 问题 ? 为 什么 ? 
b. 举 一 个 实例 说 明 家 庭 中 使 用 电缆 调制 解 调 器 访问 Internet 将 会 如 何 破坏 团体 的 
安全 。 

11.15 口令 卡 是 一 种 像 信 用 卡 一 样 的 口令 记号 产生 器 ， 它 也 有 其 他 很 多 的 名 字 为 人 所 


知 。 确 切 的 记号 是 依赖 于 当前 时 间 与 卡 的 标识 的 ， 产 生 的 记号 与 适当 用 户 的 标 
识 一 同 组 成 某 种 授权 。 当 进入 一 个 系统 或 者 一 幢 大 楼 时 ， 这 样 的 卡 可 以 用 做 
身份 认证 。 基 于 学 习 过 的 有 关 同 步 的 知识 ， 以 及 在 这 一 章 中 学 到 的 知识 ， 指 出 
随 着 这 种 口令 卡 安全 系统 的 实现 而 一 同 产生 的 两 个 优点 和 两 个 缺点 (或 者 不 
足 )。 为 什么 在 数据 在 网 络 上 传输 并 不 安全 的 环境 中 这 种 技术 非常 关键 ? 


11.16 分 布 式 安 全 经 常 要 面 对 效率 与 易 用 性 之 间 的 平衡 。 讨 论 四 个 能 够 显示 这 种 分 歧 的 
例子 。 


S128 实例 研究 : Windows 2000 


Windows 2000 是 基于 Windows NT 技术 的 ， 在 早期 开发 阶段 参照 了 Windows NT 5.0, X F 
这 个 流行 的 Windows 产品 ， 经 常 提 及 的 一 个 重要 特点 是 支持 分 布 式 计算 ， 所 以 人 们 喜欢 并 广 
泛 选用 它 作 为 分 布 式 操作 系统 的 一 个 实例 。1989 年 微软 NT 的 子 系统 设计 基本 理论 声称 Win- 
dows NT 将 是 一 个 可 移植 的 操作 系统 ， 具 有 灵活 性 ， 健 壮 性 ， 安 全 性 (全 时 的 ) 和 易 维护 性 。 
Windows 2000 的 一 个 贡献 是 它 结 合并 采用 了 一 系列 的 标准 ， 从 而 能 与 其 他 系统 进行 相互 操 
作 ， 从 而 提高 了 作为 分 布 式 操 作 系 统 的 能 力 。 本 实例 研究 将 给 出 其 中 的 一 些 特性 ， 主 要 包括 
以 下 内 容 ; 

4 微 内 核 设 计 。 

© 硬件 抽象 层 。 

4 即 插 即 用 。 

9 NT 文件 系统 。 

4 活动 目录 以 及 LDAP 和 DNS 的 使 用 。 

4 修改 日 志 。 

4 索引 服务 器 及 其 与 HTTP 的 兼容 性 。 

4 微软 管理 控制 台 。 

4 集群 服务 器 。 

4 安全 配置 编辑 器 。 

4 加 密 文件 系统 。 

4 微软 安全 支持 提供 者 接口 及 其 与 DES 和 RSA 协同 工作 的 能 力 。 

$ 与 DCOM 的 结合 。 , 

即使 有 许多 不 同 的 Windows 2000 组 件 ， 仍 然 很 少 有 人 知道 实际 上 有 四 种 Windows 2000 操 
作 系 统 。 

1. Windows 2000 专业 版 ， 用 来 替代 NT 工作 站 。 

2. Windows 2000 服务 器 版 ， 替 代 NT 服务 器 功能 ， 并 提供 了 少量 的 超 集 。 该 版 本 提供 了 
诸如 Web 服务 器 的 应 用 等 。 

3. Windows 2000 高 级 服务 器 版 ， 它 继续 提供 对 网 络 和 分 布 式 计算 的 支持 ， 包 括 对 集群 技 
术 和 负载 平衡 的 支持 。 

4. Windows 2000 数据 中 心服 务 器 版 ， 是 最 大 的 超 集 ， 最 多 能 支持 64GB 的 物理 内 存 。 

在 本 实例 研究 中 ， 讨论 了 Windows 2000 技术 的 整个 超 集 -一 一 Windows 2000 高 级 服务 器 和 
数据 中 心服 务 器 。 实 例 研 究 的 材料 取 自 微软 Windows NT 白皮书 系列 ， 包 括 Windows 2000 和 
有 关 技术 【Micr98]。 在 本 书 交 付 印 刷 时 ，Windows 2000 完整 的 产品 版 本 尚未 能 完全 提供 。 
Beta 第 2 版 及 随后 推出 的 产品 结合 了 一 些 重要 的 改变 ,包括 即 插 即 用 的 并 和 人、 活动 目录 、 微 
软 管 理 控 制 台 以 及 分 布 式 安全 扩展 等 。 为 了 与 过 去 的 内 容 相 衔接 ， 本 实例 的 某 些 内 容 仍 参 照 
早期 的 版 本 。12.1 WST Windows 2000 基本 技术 的 设计 目标 。12.2 节 给 出 了 Windows 2000 
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微 内 核 的 概述 ， 包 括 Windows 2000 地 址 空间 的 信息 。12.3 节 说 明了 Windows 2000 中 即 插 即 用 
的 实现 。Windows 2000 文件 系统 在 12.4 节 中 讨论 。 而 活动 目录 则 在 12.57 PRR, PK 
理 控制 台 是 12.6 节 的 主题 。Windows 2000 高 级 服务 器 版 中 提供 的 集群 技术 在 12.7 节 中 描述 。 
12.8 节 集 中 说 明 Windows 2000 基于 安全 的 特性 。12.9 节 给 出 了 瘦 客 户 的 简短 描述 ， 它 的 内 
部 代码 名 称 为 Hydra。 


12.1 概述 Windows 2000 设计 


微软 Windows 2000 操作 系统 有 五 个 基本 的 设计 目标 ， 继 承 了 Windows NT 的 基本 技术 。 
本 节 中 将 枚 举 这 些 目 标 并 讨论 在 设计 中 如 何 实现 它们 。 第 一 个 目标 是 健壮 性 。 大 多 数 人 都 同 
意 如 下 意见 ， 相 对 于 其 他 的 Windows 操作 系统 ，Windows NT 家 族 的 操作 系统 更 为 健壮 。 关 于 
一 个 健壮 系统 的 特征 包括 一 个 系统 抵御 操作 系统 内 部 故障 ， 以 及 偶发 的 和 故意 的 外 部 故障 的 
能 力 。 这 一 点 对 于 那些 准备 使 用 分 布 式 的 系统 、 与 网 络 连 接 的 系统 、 可 能 遭受 外 部 事件 干扰 
的 系统 是 有 益 的 。 一 个 系统 要 成 为 健壮 的 ， 必 须 以 一 种 可 预测 的 方式 运作 ， 并 且 要 基于 良好 
定义 的 界面 和 系统 行为 。 微 软 提出 的 下 述 五 个 决策 能 帮助 实现 健壮 性 目标 。 

1. 内 核 模 式 能 提供 定义 良好 的 应 用 程序 设计 接口 〈APIs) ， 并 力图 使 编程 所 需 的 参数 和 
图 形 标记 最 少 。 该 决策 可 提高 应 用 程序 实现 、 测 试 和 文档 编制 的 方便 性 。 

2. 整个 系统 采用 规范 化 设计 ， 设 计 的 文档 在 编码 前 完成 编制 。 

3, 主要 的 组 件 ， 如 Windows 32、0S/2 和 POSIX 被 分 割 成 独立 的 子 系统 ， 这 种 简洁 而 优 
美的 设计 风格 可 使 每 个 了 于 系统 只 需 专心 实现 API 集 所 要 求 的 功能 。 

4. Windows NT 及 其 子 系统 采用 基于 帧 的 例外 处 理 程 序 ， 从 市 能 采用 可 靠 而 有 效 的 方法 
来 指明 程序 设计 中 的 错误 和 坏 的 以 及 不 可 访问 的 参数 。 

5. 可 能 最 受 关注 的 决策 是 将 操作 系统 分 成 核心 模式 系统 服务 和 子 系 统 。 该 决策 的 结果 
能 避免 不 良 行 为 的 应 用 引起 操作 系统 的 甬 溃 。 

基于 Windows NT 技术 的 第 二 个 设计 目标 涉及 到 可 扩充 性 和 可 维护 性 。 它 期 望 系统 的 设 
计 能 适应 计算 机 、 计 算 机 相关 制造 商 〈 包 括 微 软 自身 ) 、 原 始 设备 制造 商 (OEM) 的 应 用 以 
及 未 来 可 预见 的 用 户 的 需求 。 就 此 观点 出 发 ， 可 能 会 与 将 Windows 2000 设计 成 支持 分 布 式 计 
算 的 目标 不 一 致 。 下 面 五 个 决策 帮助 实现 第 二 个 目标 。 

1. 系统 的 设计 是 简单 的 和 文档 化 的 ， 系 统 开 发 遵循 公共 编码 标准 ， 这 样 就 不 需要 依靠 
“民间 传说 ”来 维护 系统 了 。 

2. 系统 的 每 个 主要 部 分 作为 子 系统 实现 ， 由 此 提高 了 Windows 2000 的 隔离 与 控制 独立 
的 能 力 。 例 如 ， 如 对 POSIX 进行 改动 只 需 改变 POSIX 子 系 统 。 可 以 增加 一 个 子 系统 来 提高 系 
统 的 可 移植 性 ， 且 允许 在 一 个 分 布 式 环境 中 ， 增 加 一 个 组 件 类 型 而 不 会 影响 已 存在 的 不 使 用 
子 系统 的 早期 版 本 。 

3. 子 系统 设计 允许 附加 子 系统 。 增 加 的 子 系统 并 不 需要 对 原始 系统 或 操作 做 任何 改变 ， 
该 类 设计 应 限制 或 至 少 六 大 降低 将 来 对 以 前 功能 做 修改 而 产生 副作用 ， 以 免 对 系统 产生 不 利 
影响 。 在 分 布 式 环境 下 操作 时 ， 如 需要 更 新 组 件 ， 也 不 需要 同时 更 新 其 他 原 有 组 件 。 

4. 每 个 子 系统 的 编码 可 引入 Windows 2000 安全 特性 的 优势 ， 将 在 12.8 节 中 说 明 。 

5. 每 个 子 系统 必须 验证 或 确保 所 有 操作 参量 的 正确 性 ， 这 是 通过 在 合适 的 点 上 捕捉 其 
值 和 检查 它 的 参量 来 达到 的 。 通 常 这 种 探测 在 输出 集 上 实施 ， 特 别 是 涉及 到 指针 时 。 用 这 种 
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方法 验证 参量 能 确保 防止 调用 者 或 它 的 一 个 线程 在 读 操 作 前 动态 改变 或 者 删除 它 的 参数 值 。 
虽然 好 处 是 明显 的 ， 但 由 于 参量 经 常 送 到 寄存 器 ， 显 式 捕捉 并 不 像 它 看 上 去 那样 简单 。 如果 
参数 送 入 内 存 ， 它 由 系统 服务 调度 器 来 探测 和 捕捉 。 

第 三 个 设计 目标 是 可 移植 性 。 分 布 式 系统 的 一 个 重要 的 目标 是 可 以 在 多 种 蜡 构 平台 上 进 
行 操作 ， 特 别 是 希望 系统 的 结构 在 许多 不 同 的 硬件 平台 上 进行 操作 而 只 需 最 少量 的 重新 编码 
的 工作 。 这 个 好 处 不 仅 对 用 户 ， 而 且 对 微软 也 一 样 。 因 为 可 继续 使 用 其 资源 ， 提 高 性 能 或 开 
发 新 的 产品 ， 而 不 是 在 系统 的 最 初版 本 发 布 后 ， 仍 在 新 的 平台 上 重新 进行 开发 。 

第 四 个 设计 目标 是 关于 性 能 的 。 为 了 达到 高 性 能 首先 要 通过 选择 好 的 算法 和 相应 的 数据 
结构 ， 另 外 选择 达到 高 性 能 必须 不 影响 系统 的 灵活 性 。 

第 五 个 也 是 最 后 一 个 基于 Windows NT 技术 的 目标 可 分 为 两 部 分 。 首 先 ， 要求 应 用 与 
POSIX 相 容 的 API。 与 POSES 相 容 即 允 许 应 用 能 从 一 种 平台 (如 Windows 2000) 移植 到 另 一 
种 平台 (如 UNIX)。 或 者 可 能 对 于 微软 更 为 重要 的 是 ， 从 UNIX 移植 到 Windows 2000。 做 出 
Windows 2000 与 POSIX 兼容 的 决策 ， 包 括 UNIX 风格 的 界面 ， 可 能 是 业界 普及 应 用 的 一 个 里 
程 碑 决策 。 实 际 上 一 个 分 布 式 应 用 试图 在 非 POSIX 兼容 系统 上 和 运行， 必须 处 理 各 种 API mi 
在 POSIX 兼容 环境 中 的 相同 应 用 ， 并 不 面向 这 样 的 异 构 性 ， 从 而 能 大 大 地 简化 。 当 然 ， 一 般 
认为 这 样 的 简化 也 可 减少 出 错 的 概率 。 另 外 ， 一 些 政府 合同 要 求 与 POSIX 的 兼容 性 。 故 在 实 
际 处 于 Windows NT 执行 体外 部 的 C/S 结构 中 ， 实 际 子 系统 的 设计 将 0S/2 和 POSIX API 作为 
被 保护 子 系统 来 实现 。 子 系统 的 设计 采用 了 基于 Windows NT 的 技术 ， 与 在 运行 中 包含 API 
的 初始 NT 设计 版 本 不 同 ， 它 能 支持 所 有 的 Windows 2000 设计 目标 。 

最 后 目标 的 第 二 部 分 涉及 政府 要 求 的 C2 安全 认证 。 该 安全 认证 要 求 系统 包含 安全 性 能 ， 
例如 审核 能 力 ,访问 检测 ， 基 于 每 个 用 户 的 资源 限额 ， 以 及 资源 保护 。 没 有 这 些 特性 和 C2 
安全 认证 ，Windows 2000 就 不 能 用 于 所 有 的 政府 部 门 。 当 然 ， 某 些 商业 应 用 不 属于 政府 ， 因 
此 不 需 采 用 C2 安全 认证 系统 ， 但 大 部 分 商业 应 用 仍 希望 有 这 样 的 安全 级 别 。 


12.2 内 核 模 式 综述 


正如 第 2 章 指出 的 ，Windows 2000 的 实现 使 用 了 微 内 核 设计 。 第 2 章 集 中 讨论 了 内 核 设 
it, Windows NT 有 关内 核 设 计 的 许多 特性 在 12.1 节 中 给 出 。 这 些 信息 的 综述 列 于 表 12-1 中 。 
图 12-1 描述 了 Windows NT 2.51 及 其 以 前 版 本 关于 这 些 服 务 的 组 织 ， 而 图 12-2 则 说 明了 Win- 
dows NT 4.0 的 服务 组 织 ， 对 此 类 架构 的 主要 改进 包含 了 作为 用 户 模 式 服 务 的 即 插 即 用 的 实 
现 。Windows 2000 的 架构 在 图 12-3 中 给 出 。 如 前 所 述 ，Windows 2000 有 一 内 核 ， 逻 辑 上 分 成 
两 部 分 : 执行 体 ， 将 在 12.2.4 中 进一步 说 明 ; 使 用 内 核对 象 ， 硬 件 的 抽象 层 和 设备 驱动 程 
序 ， 将 在 12.2.1 PB 12.2.3 节 中 分 别 叙 述 。 


312-1 Windows NT MAK 














微 内 核 共 性 基于 Windows NT 技术 的 实现 
模块 化 设计 模块 化 设计 
容易 维护 所 希望 的 易 维 护 性 
区 分 所 有 依赖 于 结构 的 特性 使 用 分 离 的 子 系统 
有 限 的 设备 管理 决定 采用 即 插 即 用 手段 


容易 扩充 建立 一 个 易 扩 充 的 系统 
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图 12-2 Windows NT 4.0 基 本 体系 结构 
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12.2.1 内 核对 象 


内 核对 象 是 一 个 简单 对 象 集 ， 支 持 创 建 执行 体 层 的 对 象 。 内 核对 象 按 功能 分 成 若干 组 。 
控制 对 象 组 包含 以 下 对 象 : 

4 内 核 进 程 对 象 。 

4 延迟 过 程 调 用 对 象 (DPC). 

4 中 断 对 象 。 

另 一 组 对 象 称 为 调度 对 象 ， 能 改变 或 影响 线程 的 处 理 ， 包 含 以 下 对 象 : 

4 内 核 线程 对 象 。 

4 互 斥 体 对 象 。 

4 事件 对 象 。 

4 内 核 事 件 对 象 。 

4 信号 量 对 象 。 

4 计时 器 对 象 。 

4 能 延迟 的 计时 器 对 条 。 
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枚 举 控制 等 说 明 
用 户 模式 
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[| ape 


EL 安全 引用 





执行 体 _ 1080 即 插 即 用 接口 。。 电源 管理 接口 其 他 NT 接口 
waco ft t t t 
本 人 fw t. 
;WDM 即 插 即 用 总 线 驱 动 器 ii WDM 设备 驱动 程序 |} Windows NT 


| | BARD Sh EE 
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| = 硬件 抽象 层 (HAL ) _ 
图 12-3 Windows 2000 即 插 即 用 体系 结构 


这 些 对 象 担 供 了 定义 和 请 好 的 、 能 预测 的 原 语 和 机 制 ， 当 与 执行 体 结合 使 用 时 ， 这 些 对 象 
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能 建立 更 多 的 高 级 机 制 。 在 这 一 层 实现 的 惟一 策略 包括 线程 的 调度 和 分 派 ， 而 其 他 的 策略 留 
在 执行 体内 ， 因 此 允许 设计 的 最 大 灵活 性 。 


12.2.2 硬件 抽象 层 


硬件 抽象 屋 (HAL) 是 可 装载 的 核心 模式 模块 ， 这 一 层 提供 了 Windows 2000 运行 的 实际 
物理 硬件 的 接口 ， 功 能 是 与 特定 体系 结构 相关 的 ， 如 线程 上 下 文 转换 是 在 Windows 2000 HAL 
中 实现 的 。 所 有 依赖 于 硬件 的 细节 ， 如 LO 接口 与 中 断 控 制 器 等 ， 均 在 该 层 中 实现 。 而 其 他 
Windows 2000 内 部 组 件 与 应 用 程序 都 与 HAL 相 联 系 ， 以 获得 依赖 于 平台 的 信息 与 功能 。 这 样 
的 设计 允许 HAL 以 上 系统 的 每 一 部 分 能 满足 异 构 分 布 式 环境 需要 的 硬件 独立 操作 ， 并 能 够 
维持 可 移植 性 。 


12.2.3 设备 驱动 程序 


设备 驱动 程序 是 可 加 载 的 核心 模式 模块 。 大 多 数 设 备 驱 动 程序 以 带 有 扩展 名 “SYS” 的 
形式 存储 文件 。 这 些 驱 动 程序 提供 了 执行 体 的 VO RAS HAL 间 的 接口 。 如 果实 现 正确 ， 设 
备 驱动 程序 总 是 调用 HAL 程序 ， 故 而 维护 了 整个 系统 的 可 移植 性 。Windows 2000 中 设备 管理 
和 抽象 的 整个 方法 是 为 了 协调 和 支持 即 插 即 用 而 继续 改进 NT 4.0 的 一 个 方面 ， 鉴 于 它 对 
Windows 2000 的 重要 性 ， 设 备 驱动 程序 以 及 即 插 即 用 的 更 详细 的 信息 将 在 12.3 节 中 叙述 。 


12.2.4 执行 程序 


执行 程序 实现 Windows 2000 的 系统 服务 ， 要 求 所 有 的 系统 服务 能 确保 它 的 所 有 参数 的 有 
效 性 。 通 常 ， 所 有 参数 在 适当 点 上 被 捕获 和 检测 ， 特 别 是 对 于 指针 参数 和 需要 检测 访问 权 的 
参数 。 这 些 措施 能 防止 调用 者 或 调用 者 线程 在 参数 值 验证 后 再 去 动态 地 改变 它们 。 这 看 起 来 
似乎 加 重 了 系统 的 负担 ， 但 大 部 分 参数 是 送信 人 寄存器， 并 不 需要 显 式 地 捕获 。 系 统 服务 操作 
的 一 个 算法 在 详细 说 明 12.1 中 进行 描述 。 





详细 说 明 12.1 
系统 服务 操作 








WARIS, BERET: 
， 聊 入 处 理 程序 得 到 控制 权 。。 oe 
RARE. a - 
Prvyerer ys 7) & 
系统 服务 分 派 程序 装 得 对 应 系统 服务 的 地 址 。 
， 系统 服务 决定 内 存 中 参 收 的 数目 〈 从 分 派 表 获得 )。、 
. 如 原先 是 核心 模式 ， 内 核 调用 该 服务 ， 参数 不 会 是 坏 的 。 如 原先 是 用 户 模式 ， 则 地 址 
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被 检测 以 确保 访问 是 在 用 户 空间 内 。 站 发生 非法 访问 ， 就 引起 一 个 例外 。 


所 有 执行 程序 对 象 是 由 一 组 内 核对 象 组 成 。 下 面 是 Windows 2000 核心 模式 系统 服务 的 
列表 : 
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1 对 象 管理 器 : 对 象 管理 器 创建 、 管 理 和 删除 Windows 2000 执行 程序 对 象 ， 与 相关 的 
内 核对 象 相 比 ， 执 行程 序 丰 附加 的 语义 和 功能 。 

2. 进程 和 线程 管理 器 : 进程 和 线程 管理 器 创建 和 终止 所 有 的 进程 和 线程 。 进 程 和 线程 
管理 器 有 时 可 考虑 为 一 种 对 象 管理 器 。 线 程 作为 一 个 专题 已 在 第 2 章 讨论 过 了 

3. 安全 引用 监控 器 : 该 监控 器 负责 在 本 地 计算 机 上 实施 所 有 的 安全 策略 。 该 职责 可 扩 
充 资 源 并 实施 运行 时 的 对 象 保 护 和 审查 。 

4. 局 部 进程 调用 (Local procedure call, LPC) 设施 : LPC 设施 的 职责 是 在 客户 进程 和 服 
务 器 进程 之 间 传 送 消息 。 它 是 一 种 灵活 的 、 优 化 的 、 标 准 的 RPC 版 本 ， 相 关内 容 已 在 第 四 
章 中 讨论 过 。 

5. 虚拟 内 存 管 理 器 : 虚拟 内 存 管理 器 不 仅 是 实现 虚拟 内 存 ， 也 负责 对 有 关 私 有 地 址 空 
间 实 施 内 存 管理 调度 ， 保 护 上 述 空间 ， 并 支持 底层 高 速 缓存 。 该 地 址 空间 在 Windows 2000 中 
的 布局 在 详细 说 明 12.2 中 进行 描述 。 

6. VO 管理 器 : LO 管理 器 将 所 有 独立 设备 的 IO 请 求 放 到 相应 设备 驱动 器 上 去 实现 。 
I0 管 理 程序 与 文件 系统 、 高 速 缓存 管理 器 、 设 备 驱 动 程序 和 网 络 驱动 程序 协同 工作 。 


详细 说 明 12.2 
地 址 空间 布局 

作为 肉 核 设计 的 一 部 分 地址 空间 的 布局 设计 瑚 保 也 用户 地 址 空间 和 兼 统 地 址 空间 
的 分 离 。 在 这 两 个 区 域 之 间 有 564 KK 内 存 的 隔 栏 ， 内 核 和 所 有 用 户 都 不 能 访问 该 内 存 区 域 ， 
只 克 许 简单 地 与 边界 比较 ， 以 确定 是 合法 地 址 ， 防 止 越 界 。 内 炉 和 核心 模式 占用 系统 区 
所 有 的 页 。 用 户 补 有 用 户 地 址 空间 的 页 ， 执 行 时 绝 不 会 在 用 户 地 址 空间 创建 由 内 核 占有 
的 页 。 相 反 ， 如 有 一 页 既 映 射 到 用 户 又 映射 到 内 核 ， 列 该 页 仍 应 保存 在 内 核 地 址 空间 。 

















Windows 2000 相对 NT 4.0 的 另 一 个 重大 改进 和 变动 是 支持 海量 内 存 (very large memory, 
VIM). VLM 能 支持 28GB 的 内 存 和 64 位 的 NT 版本。 所 有 x86 系列 的 处 理 器 都 不 能 支持 
VIM, 但 Intel 与 HP 协作 开发 的 一 种 新 的 结构 系列 (名 为 Merced) 即将 推出 ， 适 用 于 真正 的 
64 位 Windows 2000。 真 正 的 64 位 系统 意味 着 每 个 64 位 的 进程 将 有 一 个 独立 的 ， 巨 大 的 地 址 
空间 ， 尺 寸 至 少 是 512GB。 这 样 就 能 满足 当今 和 将 来 基于 微软 的 应 用 程序 对 增加 存储 容量 和 
处 理 的 要 求 。 一 种 新 的 Win32 API 的 小 集合 能 应 用 于 执行 Win32 或 Win64 二 进 制 代码 。 只 有 
能 提供 VLM 的 Win32 应 用 程序 能 完全 利用 64 位 指针 的 优势 。 任 何 通 过 64 位 指针 访问 的 地 址 
必须 返回 上 锁 的 物理 内 存 。 虚 拟 内 存 不 能 提交 给 应 用 程序 ， 因 为 不 能 物理 地 提供 。 缺 页 错误 
E VIM 中 不 会 发 生 ， 除 非 那 些 地 址 是 用 来 将 数据 映射 到 一 个 实际 的 物理 文件 。 尽 管 有 这 些 
限制 ， 当 前 的 实现 仍 被 认为 是 朝 着 未 来 正确 方向 而 迈 出 的 重要 一 步 ， 将 对 类 似 于 数据 库 管 理 
那样 数据 集中 的 应 用 带 来 好 处 。 


12.3 即 插 即 用 


即 插 即 用 结合 了 软 、 硬 件 的 支持 ， 提 供 了 微软 Windows 2000 CE) 自动 识别 和 适应 硬件 
配置 改动 的 能 力 ， 从 而 允许 设备 动态 地 变化 ， 尤 其 是 这 些 改变 不 需要 手工 配置 ， 或 是 对 设备 
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有 具体 的 了 解 ， 而 是 由 即 插 即 用 管理 器 自动 地 接收 设备 配置 。 即 插 即 用 不 仅 能 让 动态 改变 的 
一 组 设备 一 起 工作 ， 而 且 还 能 不 需要 用 户 的 介入 。 有 许多 理由 可 以 证 明 此 特性 对 分 布 式 系统 
很 有 利 。 一 个 实际 的 好 处 是 减轻 系统 管理 员 的 负担 ， 因 为 有 许多 设备 和 系统 接 入 分 布 式 系 
统 。 系 统管 理 员 的 注意 力 应 该 放 到 一 些 细节 上 ， 而 不 是 在 每 个 成 员 系 统 加 入 了 一 个 新 的 部 件 
时 去 配置 系统 。 此 外 ， 即 插 即 用 对 于 笔记 本 电脑 来 讲 也 允许 某 一 时 刻 连接 到 局 域 网 ， 然 后 关 
闭 ， 再 经 调制 解 调 器 与 另 一 局 域 网 连接 ， 而 不 需要 用 户 参 与 对 系统 的 配置 。 如 果 说 即 插 即 用 
对 Windows 并 不 新 鲜 ， 但 对 于 基于 NT 技术 的 产品 线 和 Windows 2000 来 说 则 是 新 的 。 即 插 即 
用 的 简短 历史 在 详细 说 明 12.3 中 叙述 。 





详细 说 明 12.3 











即 播 即 用 设计 是 由 驱动 程序 及 对 应 的 对 象 组 成 的 分 层 结 构 构 成 ， 下 面 讨论 这 种 结构 中 的 
每 一 种 主要 部 件 。 

核心 模式 即 插 即 用 管理 器 负责 维护 中 心 控 制 。 具 体 地 说 ， 由 它 指挥 总 线 驱 动 器 执行 所 连 
接 设备 的 枚 举 和 配置 ， 接 着 引导 设备 驱动 程序 加 入 一 个 设备 ， 启 动 该 设备 或 执行 其 他 任何 相 
应 的 操作 。 管 理 器 必须 与 用 户 模式 即 揪 即 用 中 的 对 应 部 分 配合 以 协调 设备 的 暂停 、 移 走 和 同 
步 ， 这 些 设 备 在 系统 认为 需要 且 合 适 的 时 间 应 该 可 以 提供 这 些 操作 。 

核心 模式 组 件 中 ， 电 源 管理 器 与 策略 管理 器 协同 处 理 电 源 管理 API、 协 间 电 源 事件 以 及 
生成 有 关 电 源 管理 的 W/O 请 求 包 (IRP)。 例 如 ， 当 系统 同时 接收 到 多 个 “关闭 ”请 求 时 ， 由 
电源 管理 器 收集 这 些 请 求 。 当 收 到 请 求 后 ， 它 决定 是 否 所 有 请 求 需要 序列 化 或 排序 ， 并 生成 
相应 的 IRP， 策 略 管理 器 监控 系统 的 动作 。 收 集 的 信息 涉及 到 用 户 、 应 用 程序 和 设备 驱动 程 
序 的 状态 ， 把 它们 集成 到 电源 策略 中 。 在 请 求 或 特殊 情况 下 ， 策 略 管理 器 也 能 生成 IRP 来 改 
变 设 备 电源 状态 。 

VO 管理 器 提供 设备 驱动 的 核心 服务 ， 有 具体 地 讲 就 是 将 用 户 模式 的 读 或 写 翻 译 成 读 或 写 
的 IRP 的 核心 模式 组 件 。 另 外 ， 它 还 管理 所 有 的 主 系统 IRP。Windows 2000 中 的 VO 管理 器 
的 接口 与 Windows NT 4.0 的 相同 ， 因 此 尽管 4.0 并 不 支持 即 插 即 用 ， 也 可 在 Windows NT 4.0 
上 配置 一 个 即 插 即 用 驱动 器 。 

微软 的 Win32 驱动 器 模型 (Win32 Driver Model, WDM) 的 即 插 即 用 接口 为 驱动 器 提供 
了 一 个 分 层 的 结构 。 该 接口 允许 不 同类 型 的 WDM 了 驱动器、 驱动 器 层 和 设备 对 象 。 在 即 插 即 
用 结构 中 ， 有 三 种 基本 茉 型 的 驱动 器 。 

1. 总 线 驱动 器 : 驱动 /0 总 线 与 任何 独立 于 设备 的 每 个 横 口 功能 。 即 插 即 用 总 线 是 连接 
物理 、 人 逻辑 或 虚拟 设备 等 的 设备 ， 可 包含 传统 总 线 如 SCSI 或 PCI， 也 可 以 是 并 行 或 RS232 $ 


B12¢ FRA: Windows 2000 203 





行 端口 的 总 线 。 

2. 功能 驱动 器 : 驱动 个 别 的 设备 。 

3, 过 滤 驱 动 器 : 通过 过 滤 对 某 个 设备 、 一 类 设备 或 某 一 总 线 的 请 求 ， 隔 离 对 设备 的 VO 
请 求 。 

每 一 设备 能 有 两 个 或 更 多 的 驱动 器 层 一 一 有 关 的 底层 VO 总 线 的 总 线 驱 动 器 ， 明 确 的 即 
插 即 用 管理 器 以 及 某 设备 的 功能 驱动 器 。 换 名 话说 ， 某 一 给 定 设备 对 总 线 和 /或 设备 可 使 用 
一 个 或 多 个 过 滤 驱 动 器 。 

每 个 即 插 即 用 驱动 器 为 每 一 个 由 其 控制 的 设备 建立 如 下 的 设备 对 象 ; 

1. 物理 设备 对 象 (PDO): 表示 总 线 驱 动 器 的 总 线 上 的 独立 设备 。 

2. 功能 设备 对 象 (FDO): 表示 功能 驱动 器 上 的 独立 设备 。 

3. 过 滤 设 备 对 象 《 过 小 DO): 表示 过 滤 驱 动 嚣 上 的 独立 设备 。 

WDM 总 线 驱 动 器 用 来 控制 总 线 电 源 管理 以 及 即 插 即 用 。WDM 总 线 了 驱动 器 是 标准 的 
WDM 驱动 器 ， 用 来 扩充 总 线 的 能 力 。 回 顾 在 Windows 2000 中 ， 有 着 对 其 他 设备 的 枚 举 的 任 
一 设备 可 看 作 是 一 个 总 线 。 下 面 是 WDM 总 线 驱 动 器 基本 职责 : 

4 在 总 线 上 枚 举 设备 ， 应 包括 标识 这 些 设 备 和 创建 设备 的 设备 对 象 。 

4 报告 系统 在 其 总 线 上 的 动态 事件 。 

4 响应 IRP。 

4 合适 时 多 路 访问 总 线 。 

4 执行 其 他 所 需 的 工作 ， 以 管理 总 线 上 的 设备 。 

每 当 总 线 驱动 器 以 设备 名 义 在 其 总 线 上 实行 某 些 操作 时 ， 它 并 不 对 设备 执行 读 / 写 操作 
(实际 上 是 由 有 关 的 功能 驱动 器 来 执行 )。 惟 一 的 例外 情况 是 当 总 线 驱 动 器 合并 到 与 功能 驱动 
器 一 样 的 执行 总 线 驱 动 器 职责 的 驱动 器 中 。 作 为 这 种 多 功能 驱动 器 的 一 个 例子 是 包含 总 线 控 
制 器 、 适 配器 、 网 桥 或 是 ACPI 驱动 器 的 总 线 驱 动 器 。 关 于 ACPI 见 详细 说 明 12.4。 





详细 说 明 12.4 
| 高 级 配置 与 电源 接口 

















ACPI 是 由 OneNow 设计 思路 击 来 的 ， 它 项 望 定义 一 种 综合 的 系统 范围 的 方法 来 控 制 系 
统 和 配置 设备 以 及 管理 电源 【Mier98]。ACPIT 1.0 版 本 定义 了 一 种 新 的 系统 板 和 BIOS, 该 
HH AAT 到 即 所 即 用 数据 使 其 包含 电源 管理 和 附加 配置 的 能 力 ， 所 有 这 些 是 在 操 
作 系统 的 完全 控制 之 下 。 

Windows 2000 对 包含 了 ACPI 系统 板 的 计算 机 进行 了 优化 。ACPI 的 主要 好 处 之 一 是 提 
供给 操作 系统 获悉 某 种 设备 的 能 力 ， 此 种 设备 既 不 能 以 标准 方法 枚 举 给 总 线 驱 动 器 ， 也 
可 能 只 是 一 个 新 的 设备 (例如 一 个 嵌入 式 控制 器 )。 此 外 ，ACPI 能 装 入 高 层 过 湾 驱 动 器 。 
这 种 能 力 对 于 访问 那些 功能 超过 了 总 线 标准 的 设备 是 非常 有 用 的 ， 因为 它 可 以 提供 这 种 
BBL, tle, RAXAT 带 有 电源 控制 的 图 形 控制 器 ， 但 PCL 总 线 不 支持 ， 而 ACPI 
驱动 器 可 和 装 入 高 层 过 滤器 访问 这 些 附加 的 功能 。 使 用 这 种 方法 ，ACPI 能 为 系统 提供 附加 
的 灵活 性 。 这 种 设计 不 仅 给 需要 高 级 电源 管理 的 膝 上 型 电脑 提供 了 好 处 ;对 人 台式 计算 机 
用 户 也 是 很 有 益 的 ， 他 们 不 青 需 要 等 待 操作 系统 的 启动 。 
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用 户 模式 即 插 即 用 组 件 提 供用 户 模式 API， 用 来 控制 和 配置 设备 ， 它 们 是 基于 Windows95 
的 32 位 扩充 版 本 配置 管理 器 API。 在 功能 上 这 些 APIs 是 Windows 95 SetupxDi 程序 的 一 个 
超 集 ， 但 仅仅 是 用 户 模式 API， 其 应 用 程序 能 用 于 创建 定制 的 硬件 事件 管理 或 是 建立 新 硬件 
事件 。 

上 面 叙 述 了 体系 结构 ， 现 在 讨论 即 插 即 用 在 Windows 2000 的 串 行 设备 RS232 中 的 实现 。 
Windows 的 早期 版 本 要 求 每 个 硬件 供应 商 实 现 检 测 协 议和 提供 总 线 驱 动 器 ， 在 Windows 2000 
中 由 Serenum.sys (KREPITI, Serial enumeration) 提供 这 些 功 能 。 当 Serenum.sys 找 
到 一 个 硬件 ， 就 为 发 现 的 设备 建立 一 个 PDO, Serenum.sys BAH T RS-232 设备 的 总 线 驱 
动 器 功能 ， 也 发 挥 了 过 沽 驱动 器 的 功能 。 由 于 Windows 2000 已 实现 了 协议 和 驱动 器 ， 上 述 设 
计 能 享用 所 有 重用 代码 的 传统 优势 。 由 Serenum. sys 处 理 的 传统 串 行 设备 包括 鼠标 、 指 示 
设备 、 调 制 解 调 器 、 数 字 相 机 等 。 所 有 非 即 插 即 用 串 行 设备 不 使 用 Serenum.sys， 它 们 需 
人 工 安装 。 这 些 遗 留 的 设备 和 它们 遗留 的 驱动 器 在 即 插 即 用 环境 中 与 在 原 遗 留 环境 中 进行 同 
样 的 工作 。 实 际 上 有 些 即 插 即 用 设备 的 安装 过 程 并 不 选择 利用 即 播 即 用 驱动 器 ， 因 此 它们 并 
不 享用 优化 的 即 插 即 用 支持 。 有 关 微 软 Windows NT 4.0 如 何 处 理 串 行 设备 见 详细 说 明 12.5。 








详细 说 明 12.5 
Windows NT 4.0 中行 设备 驱动 器 














为 了 充 许 独 立 硬件 供应 商 在 NT 4.0 上 使 用 束 行 总 线 驱 动 器 ， 需 要 接 一 定 次 库 装 上 所 | 
有 素 行 设备 驱动 程序 。 束 行 总 线 驱 动 器 叫做 Serial.sys， 刀 许 硬件 连接 到 NT 4.0 的 计算 机 
上 。 为 4， 0 设计 的 驱动 BRAT Serial. sys 的 装 入 次 序 ， 需要 经 过 修改 才能 在 Windows 2000 
中 操作 。 











12.4 Windows 2000 中 的 NT 文件 系统 


Windows NTFS 可 参阅 [CAPK98，Micr98 ]。 它 支持 几 种 文件 系统 ,包括 NT 文件 系统 
(NTFS) 、 文 件 分 配 表 (FAT 用 于 3.5 英寸 磁盘 中 ) 、FAT 32 (用 于 Windows 98 卷 ) 、CD 文件 
系统 (CDFS， 用 于 存储 在 光盘 上 的 数据 ) 和 通用 磁盘 格式 (UDF， 用 于 按 DVD 格式 存储 的 
数据 )。 文 件 系统 如 能 提供 文件 在 不 同 介 质 之 间 的 替换 则 认为 是 兼容 的 。 所 有 前 面 提 到 的 文 
件 系统 除了 NTFS 以 外 都 是 兼容 的 。 然 而 ， 在 Win32 中 调用 文件 系统 操作 不 考虑 其 底层 的 文 
件 系 统 类 型 ， 给 定 卷 可 使 用 任何 文件 系统 ， 默 认 文件 系统 的 类 型 是 在 卷 被 格式 化 时 就 确定 
的 。 对 于 NIFS 第 5 版， 底层 的 盘 上 数据 格式 已 改变 过 ， 需 要 所 有 NT 4.0 和 使 用 Windows 
2000 和 NT 4.0 的 组 合 的 系统 使 用 一 个 服务 包 以 实现 互 操作 。 新 的 NTFS 5.0 已 有 称 为 面向 卷 
或 面向 目录 的 特性 。 新 的 NTFS 5.0 面向 卷 的 特性 使 访问 控制 表 (ACL) 的 检索 加 速 ， 将 在 
12.4.1 节 中 说 明 。Windows 2000 中 新 的 NTFS 面向 文件 的 特性 包括 再 解析 点 ， 将 在 12.4.2 节 
中 说 明 。 还 有 优化 的 存储 管理 ， 这 将 在 12.4.3 节 中 叙述 。 附 加 的 特性 ， 如 修改 日 志和 复制 
支持 都 与 目录 服务 相关 ,它们 将 在 12.5 节 中 讨论 。 


12.4.1 访问 控制 表 
NT 4.0 采 用 访问 控制 表 (ACL) 作为 安全 措施 的 一 部 分 来 保护 访问 。 文 件 ACL 是 在 每 次 
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物理 共享 时 进行 管理 ， 而 不 能 在 系统 范围 内 进行 管理 ， 另 外 ACL 不 能 维持 不 同 卷 之 间 的 一 
致 性 。 由 于 ACL 不 能 在 不 局 卷 之 间 保 持 一 致 性 ， 最 后 的 这 一 个 事实 可 能 会 使 人 们 吃惊 ， 但 
这 一 决策 是 必需 的 ， 其 理由 如 下 : 

4 为 了 使 ACL 能 保证 在 不 同 卷 之 间 状 态 一 致 ， 必 须 采 用 集中 式 数 据 库 。 该 数据 库 可 以 
“网 络 使 用 ”或 通过 网 络 使 用 物理 资源 ， 从 而 绕 过 了 ACL 系统 。 

4 由 于 逻辑 分 布 式 文件 系统 在 FAT 和 NTFS 卷 间 通用 ， 没 有 实用 的 方法 能 设置 一 个 从 
NTFS 继承 的 DENY ACL， 使 其 从 FAT 传 至 NTFS， 终 止 于 NetWare 卷 ( 很 可 能 出 现 要 求 
托管 适当 功能 的 需求 情况 )。 

4 为 了 建立 一 个 工具 以 “ 走 查 ” 逻 辑 名 字 空 间 以 及 合适 地 设置 ACL， 需 要 一 种 复杂 的 组 
合 了 消息 /事务 的 引擎 来 对 不 可 靠 网 络 进行 排队 和 更 新 。 这 种 独特 的 想法 在 很 多 情况 
下 是 很 危险 的 ， 包括 需 要 资源 去 执行 。 

+ 由 于 Windows 2000 支持 存储 限额 ， 卷 间 ACL 的 支持 需要 存储 和 计算 所 有 可 能 卷 的 
限额 。 

要 支持 所 有 前 面 提 到 的 要 求 ， 必 须 有 一 种 “全 有 或 全 无 ”选择 。“ 全 有 ”选择 会 产生 一 

个 非常 慢 的 系统 ， 因 此 如 果 依 靠 当 今 的 技术 它 是 不 可 行 的 。 或 许 随 着 技术 的 继续 改进 ， 某 一 
天 此 技术 能 在 Windows 环境 中 提供 。 

Windows 2000 中 ， 加 入 了 称 为 ACL 检索 加 速 器 的 优化 ， 可 使 ACL 更 高 效 ， 尤 其 是 每 个 
ACL 在 给 定 卷 中 只 会 物理 地 出 现 一 次 。 可 以 采用 hash 函数 以 及 将 所 有 ACL 存储 在 公共 区 域 
中 。 微 软 [Micr98] 指出 采用 这 种 选择 的 两 大 好 处 ; 首先， 维护 ACL 需要 的 总 的 存储 空间 可 
大 大 减少 ; 其 次 ， 由 于 负载 的 降低 ， 验 证 和 人 允许 用 户 访问 相应 文件 所 需 的 总 的 时 间 也 大 为 减 
少 。 但 是 ， 当 前 还 没有 可 比较 的 测试 标准 。 


12.4.2 再 解析 点 


为 了 允许 任意 地 操作 一 个 文件 或 目录 ， 在 Windows 2000 中 采用 了 再 解析 点 ， 它 能 使 用 分 
层 的 文件 系统 过 滤器 。 这 非常 有 利于 处 理 从 一 个 系统 传送 到 另 一 系统 的 文件 ， 或 是 几 个 不 同 
类 型 的 文件 合并 到 一 个 文件 中 。 相 对 于 严格 按 标准 方法 来 确定 的 静态 处 理 〈 参 见 第 8 章 )， 
这 种 技术 允许 在 处 理 的 时 候 才 确定 如 何 处 理 文件 ， 由 此 可 建立 一 类 动态 文件 处 理 能 力 。 实 际 
上 ， 这 样 可 以 防止 系统 “ 按 封面 来 评判 一 本 书 ” 的 弊病 ， 而 提供 了 再 解析 和 重新 评估 应 如 何 
通过 使 用 过 滤器 来 处 理 文件 的 能 力 。 通 过 强制 文件 名 再 解析 ， 再 解析 点 改变 了 标准 打开 文件 
处 理 的 方式 。 每 当 遇 到 一 个 再 解析 点 ，NTFS 将 再 解析 数据 放 什 到 相应 缓冲 区 中 ， 该 缓冲 区 
可 以 由 文件 系统 过 滤器 接受 。 再 解析 点 是 一 个 系统 控制 的 属性 ， 称 为 $ REPARSE。 它 大 大 改 
善 了 系统 处 理 不 同类 型 文件 的 能 力 ， 因 为 在 分 布 式 环境 中 ， 由 于 系统 的 存在 ， 有 些 文件 类 型 
可 能 是 非 本 地 的 。 任 何 文件 或 空 目录 都 可 设置 该 属性 。 再 解析 标记 是 32 位 长 ， 分 成 下 列 几 
个 组 : 

4 0 一 15 位 : 标记 值 。 当 文件 需要 再 解析 时 ， 该 字段 用 来 确定 专门 的 再 解析 标记 。 

4 16 一 28 fu: 保留 位 。 该 字段 用 来 与 标记 值 联结 。 

429 位 : N。 第 三 位 是 名 字 代 用 指示 位 。 如 果 设 置 成 1， 名 字 代 用 位 指出 : 再 解析 点 表 

示 系 统 中 另 一 个 命名 实体 。 

430 位 : L。 第 一 位 是 延迟 位 ， 如 果 设 置 成 1， 该 延迟 位 表示 将 使 用 足够 的 延迟 去 取出 
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第 一 个 字 节 ， 并 由 此 导致 用 户 界面 需 用 一 个 图 标 显示 该 实体 ， 例 如 一 个 沙漏 。 
4 31 位 : 最 高 次 序 位 是 微软 位 。 如 果 再 解析 标记 是 微软 标记 ， 就 设置 成 1， 和 否则 就 设置 
成 0。 

如 果 遇 到 一 个 再 解析 点 ， 用 户 控制 的 数据 将 放 入 缓冲 区 ， 并 使 它 对 文件 系统 可 用 。 通 过 
包含 在 保留 位 和 标记 值 中 的 信息 ， 安 装 好 的 文件 过 滤器 会 来 处 理 该 请 求 。 每 个 过 滤器 有 两 次 
机 会 检查 每 个 IO 请 求 ， 就 是 在 请 求 进出 过 滤器 堆栈 的 时 候 。NTFS 自身 放 在 该 堆栈 中 ， 在 
其 他 的 过 滤器 之 下 ， 再 解析 点 的 主要 优越 性 是 能 使 Windows 2000 与 第 三 方 文件 系统 过 滤器 相 
互 操作 ， 也 允许 实施 定制 的 和 高 级 的 存储 管理 特性 。 


12.4.3 存储 管理 


基于 服务 器 的 以 及 远程 存储 环境 的 有 效 存储 管理 是 由 Windows 2000 中 的 两 个 服务 提供 
的 。 第 一 个 存储 管理 服务 是 一 种 单 实例 存储 方案 ， 该 方法 可 识别 在 一 卷 内 复制 的 数据 流 ， 并 
且 可 用 单一 实例 的 引用 替换 。 经 常 无 意 间 被 复制 的 信息 包括 字体 文件 、 共 享 库 或 是 能 执行 的 
共享 应 用 。 如 果 这 些 共享 数据 已 被 修改 ， 引 用 应 按 写 时 复制 方法 或 是 按 第 8 章 中 描述 的 事务 
完成 方法 标注 。 正 如 人 们 所 设想 的 那样 ， 单 实例 存储 方法 的 优点 包括 减少 存储 空间 和 简化 管 
理 机 制 。 

第 二 个 调度 方法 是 远程 存储 ， 这 种 机 制 允 许 需要 在 更 新 时 调用 远程 存储 成 为 本 地 存储 。 
通常 远程 存储 使 用 的 数据 是 曾经 活动 的 数据 ， 但 此 后 成 为 相对 的 非 活动 数据 。 远 程 存储 的 逮 
辑 非常 类 似 于 储藏 冬天 的 外 套 。 在 冬天 ， 外 套 是 活动 的 ， 经 常 要 使 用 ， 但 当 春 回 大 地 时 ， 这 
些 外 套 变 成 不 经 常 使 用 ， 会 搬 到 次 要 的 存储 位 置 ， 例 如 雪松 木 箱 中 。 设 想 突 然 出 现 一 个 寒流 
《当然 ， 是 在 外 套 移 至 木 箱 后 的 一 周 ) ， 如 果 当 你 打开 衣柜 ， 该 外 套 已 意 想 不 到 地 从 木 箱 回 到 
衣柜 而 不 需 你 的 物理 介 八 ， 那 将 是 何等 精彩 ， 最 多 只 需要 打开 衣柜 门 并 等 待 一 会 儿 。 本 例 展 
示 了 远程 存储 调度 方法 的 行为 。 数 据 移 至 远程 存储 后 仍 出 现在 本 地 ， 不 过 搜寻 该 数据 的 延迟 
可 能 会 稍微 增加 。 最 明显 的 好 处 是 用 户 的 操作 不 需要 改变 ， 而 且 用 户 不 需要 知道 数据 已 经 从 
主 存储 器 移 至 辅助 存储 器 或 是 相反 ， 这 些 操 作对 用 户 是 透明 的 。 


12.5 活动 目录 


Windows 2000 服务 器 的 重大 变化 之 一 是 引 人 了 新 设计 的 目录 服务 即 所 谓 的 活动 目录 ， 它 
吸取 了 第 8 章 中 叙述 的 DNS 和 X.500 的 最 佳 特性 的 优点 。 这 种 服务 大 大 改善 了 以 前 的 分 布 式 
文件 系统 (DFS) IRS, DFS 是 微软 基于 Windows NT 技术 的 早期 版 本 。 活 动 目录 为 当前 的 
Windows NT 4.0 操作 系统 用 户 提供 的 易于 升级 的 机 制 。 微 软 将 活动 目录 描述 为 一 种 安全 的 、 
分 布 式 的 、 分 割 的 和 复制 的 目录 服务 。 它 的 作用 是 简化 分 布 环境 下 信息 的 导航 和 管理 。 它 提 
供 了 简单 明了 的 API， 支 持 广 泛 的 定义 良好 的 协议 和 格式 。 它 与 义 .500 的 关系 在 详细 说 明 
12.6 中 有 相关 描述 。 微 软 是 希望 设计 成 一 种 提供 透明 的 ， 但 紧密 集成 的 目录 系统 以 帮助 管 
理 和 维护 当今 网 络 计 算 汪 境 下 的 海量 文件 和 资源 (如 果 历 史 是 简单 地 重复 ， 这 些 可 能 对 于 明 
天 的 存储 需求 来 讲 太 小 了 )。 建 立 活动 目录 是 为 了 解决 分 布 式 环境 中 多 种 服务 器 等 级 与 名 字 
空间 的 统一 和 排序 问题 ， 时 间 将 验证 它 是 否 解决 了 这 些 问 题 。 活 动 目录 的 设计 特性 和 优点 
如 下 : 

4 API 设计 成 便于 脚本 语言 和 C/C++ 的 程序 员 使 用 的 形式 。 
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详细 说 明 12.6 
活动 目录 与 X.500 











由 于 不 需要 系统 将 第 名 章 中 叙述 的 .500 完整 的 目录 系统 作为 宿主 ，Windows 2000 通 
过 使 用 在 RFC 2251，RFC 2252, REC 2255 和 RFC 2256 中 提 到 的 轻 量 级 目录 访问 协议 
(LDAP) 来 支持 义 .500 信息 模型 。 另 外 ， 活 动 目 录 支 持 X.S00 的 目录 访问 协议 (DAP), 
有 目录 系统 协议 (DSP) SURE SERPS ke 1.3% Windows 2000 操作 系统 方案 不 
同 于 X.500， 主 要 有 下 列 几 点 

1. Windows 2000 基于 TCP/IP, 而 不 是 X.500 预期 的 OSI 

2.X.500 需要 一 些 定 双 过 的 部 门 来 管理 树 的 顶层 ， 即 国际 上 每 个 国 家 的 全 球 目 录 服 
$234), Windows 2000 不 使 用 这 样 一 种 全 球 结构 。 

3. X.S00 中 的 名 字 是 -一 系列 的 三 元 组 ， 如 第 8 章 所 展示 的 ， 而 Windows 2000 使 用 In- 
temet 格式 的 名 字 ， 如 galli@ compenyname. com 

4. Windows 2000 定义 了 实际 的 API， 以 克 放 各 种 工具 与 它 的 月 好 服务 通过 接口 进行 通 
43; X.500 不 定义 API. . 





4 使 用 拖 放 式 管理 和 分 层 域 结构 ， 目 的 是 使 管理 者 感到 既 简 单 又 直观 。 

4 通过 一 种 可 扩展 的 调度 方法 提供 目录 对 象 的 可 扩展 性 。 

+ 通过 一 种 全 局 A 录 快 速 查找 和 Internet 发 布 。 

4 利用 多 主体 复制 来 获得 有 效 和 方便 的 更 新 。 

$ 支持 短 周期 跨度 的 服务 ， 如 图 表 ，IP 电话 和 会议 服务 。 

4 向 后 兼容 性 。 

@ 与 NetWare 环境 的 互 操作 。 

活动 目录 可 看 做 是 服务 提供 者 ， 它 的 功能 汇总 在 图 12-4。 目 录 结 构 可 跟 据 使 用 该 系统 的 
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图 12-4 活动 目录 功能 图 
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企业 的 规模 大 小 而 进行 灵活 设计 ， 因 此 它 能 满足 从 最 小 的 公司 到 最 大 的 跨国 公司 对 目录 的 需 
求 。 当然 ， 最 大 的 挑战 是 能 提供 整个 系统 足够 的 稳定 性 以 使 人 们 信服 。 无 论 如 何 ， 微 软 承 
H: 该 目录 系统 不 仅 能 与 Windows NT 服务 器 的 早期 版 本 互 操作 ， 也 能 与 大 部 分 Novel Net- 
Ware 3.x 和 4.x 实 现 互 操作 。 


12.5.1 名 字 空间 


Internet 名 字 空 间 的 概念 通过 使 用 DNS 作为 本 地 服务 而 集成 到 Windows 2000 目录 服务 概 
念 中 。 采 用 这 个 本 地 服务 将 一 个 名 字 翻 译 成 一 个 下 地址。 这 种 集成 的 意图 是 建立 一 个 可 扩 
展 的 、 统 一 的 、 可 管理 的 环境 。 这 种 名 字 空 间 的 优点 如 下 : 

4 支持 开放 的 标准 ,包括 域名 系统 (DNS) 和 标准 协议 ， 例 如 LDAP 和 HTIP。 有 关 名 字 

空间 的 更 多 信息 已 在 12.4.1 节 中 给 出 。 

4 支持 标准 的 名 字 格 式 以 便于 迁移 和 使 用 。 

Windows 2000 允许 多 重 域 名 连接 成 树 结构 。 一 个 分 别 从 本 地 和 经 Internet 观察 到 的 有 关 
对 象 名 的 例子 如 图 12-5 所 示 。Windows 2000 并 不 使 用 主要 的 或 备用 的 域名 控制 器 ， 而 是 认为 
所 有 的 域名 控制 器 是 同等 的 ， 因 此 任何 以 及 所 有 对 域名 控制 器 的 更 新 将 复制 到 所 有 其 他 的 域 
和 名 控制 器 。 为 了 解析 不 认识 的 名 
字 ，Windows 2000 操作 系统 采用 Division. Myco.com/Group/Sys/JamesSmith 
Windows Internet 名 字 服 务 。Win- 
dows Intemet 名 字 服 务 与 DNS 的 
集成 是 一 个 过 渡 性 产品 直至 DNS 
的 Intemet 标准 更 新 为 支持 动态 
DNS 的 时 候 为 止 。 动 态 DNS 多 
许 客 户 端 被 动态 地 指派 地 址 ， 并 
自由 地 注册 和 更 新 DNS 38. 

将 多 重 域 构 成 一 棵 域 树 是 微 
软 Windows 2000 能 提供 巨 扩展 性 
的 主要 原因 。 特 别 是 名 字 空 间 结 / 











Myco.com 


Division.Myco.com 


构 利 用 自 底 向 上 的 方法 构建 树 ， 
而 自 项 向 下 分 割 过 程 更 复杂 、 更 
耗费 时 间 。 整 个 名 字 空 间 构 成 一 
片 森林 ， 认 为 每 个 子 树 是 Win- 图 12-5 Windows 2000 基于 DNS 的 位 置 服务 的 两 种 视图 
dows 2000 的 一 个 域 ， 并 向 DNS 

通报 它 的 存在 。 这 种 树 结构 因 活 

动 目录 而 是 可 能 的 。 每 个 域 是 目 

录 的 完整 部 分 ， 域 能 进一步 细 分 

成 组 织 单元 (0U) ， 如 图 12-6 所 人 
示 。 这 些 0U 用 于 管理 目的 ， 也 \ 
额外 地 对 建立 域 树 中 上 千 万 个 对 OU= ARET 

象 的 结构 有 所 帮助 。 图 12-6 ” 域 划分 成 组 织 单元 (OU) 


JamesSmith 
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12.5.2 通过 修改 日 志 实 现 复 制 和 可 扩展 性 


现在 研究 使 微软 的 对 等 多 主体 复制 机 制 取得 最 大 效率 的 方法 。 在 任何 大 型 系统 中 要 管理 
大 量 共享 文件 的 机 器 集合 ， 需 要 一 种 简单 和 合理 的 文件 共享 复制 服务 ， 如 同 第 8 章 中 讨论 过 
的 。 本 节 中 将 说 明 Windows 2000 提供 的 文件 复制 服务 。 我 们 在 第 4 章 中 已 学 过 存储 管理 的 内 
容 ， 如 果 文 件 严格 地 为 读 而 进行 复制 ， 实 现 是 很 容易 的 。 如 果 大 多 数 的 文件 访问 只 是 只 读 
的 ， 系 统 总 的 效率 将 保持 最 低 。 活 动 目录 方法 的 关键 是 基于 这 样 的 观测 : 所 有 的 目录 服务 需 
RP 99% 是 询问 的 ， 而 更 新 需求 仅 占 1%。 多 主体 复制 方法 允许 多 重复 制 ， 其 中 的 每 一 个 都 
被 认为 是 主体 ， 而 不 是 相对 一 般 的 主 / 副 方法 。 因 此 ， 这 似乎 是 更 先进 的 对 等 解决 方案 ， 对 
等 方法 显然 具有 更 大 的 可 扩展 性 。 

可 能 会 产生 这 样 一 个 问题 : 在 采用 多 主体 拷贝 时 ， 如 何 维持 第 9 章 中 所 讨论 的 数据 的 一 
致 性 。 为 了 获得 数据 变化 的 某 种 次 序 ，Windows 2000 使 用 一 种 修改 日 志 的 方法 。 修 改 日 志 在 
卷 上 实现 修正 控制 。 修 正 控制 是 跟踪 修改 的 通用 概念 ， 它 是 通过 对 每 个 改变 加 以 标记 记录 并 
枚 举 每 个 改变 。 修 改 日 志 能 使 系统 管理 员 管 理 大 量 的 文件 和 目录 ， 并 跟踪 这 些 实体 的 变动 。 
每 次 新 的 改变 都 附 有 改变 的 理由 ， 这 些 改 变 理 由 都 伴随 着 打开 /关闭 对 话 。 微 软 通 过 采用 更 
新 序列 数 (USN) 和 缓和 使 用 物理 时 间 惟 排序 引起 的 所 有 问题 (在 第 10 章 中 讨论 ) 来 选择 
使 用 逻辑 排序 。 这 样 ， 每 个 记录 包含 64 位 USN 标识 。USN 随 着 每 次 修改 而 单调 上 升 。 当 没 
有 记录 维持 只 读 访问 时 ， 有 21 个 操作 会 引起 修改 记录 ， 这 些 操作 如 下 : 

4 建立 一 个 目录 。 

4 删除 一 个 目录 。 

4 修改 文件 中 的 数据 。 

4 问 文件 中 附加 数据 。 

4 修改 文件 属性 ， 包 括 ACL. 

$ 重 命名 一 个 文件 。 

每 个 这 种 修改 记录 通常 小 于 128 字 节 。 在 这 128 FPF, UN 记录 包含 指向 父 文件 、 源 
文件 、 改 变 的 实体 以 及 提示 改变 原因 的 域 的 引用 。 通 过 使 用 修改 日 志 ，Windows 2000 允许 信 
息 的 多 重 存储 ， 人 允许 每 个 存储 保存 多 于 1 千 万 个 对 象 。 任 何 时 候 当 用 户 在 目录 中 写 人 一 个 对 
象 ， 该 对 象 就 接收 一 个 USN。USN 按 计 算 机 保存 ， 每 次 对 象 改 变 使 其 增加 。 增 加 的 值 随后 连 
同 写 人 修改 的 计算 机 的 签名 一 起 写 入 该 对 象 。 除 了 利用 USN 作为 对 象 内 容 ，USN 还 集成 到 
每 个 目录 对 象 特性 中 。 与 对 象 USN 类 似 ， 对 象 特 性 USN 在 每 次 特性 修改 时 增加 。 复 制服 务 
与 修改 日 志 一 起 记录 文件 航 修 改 并 惟一 地 标识 每 次 修改 。 这 就 提出 了 对 于 一 个 给 定 文件 标识 
每 次 修改 的 能 力 的 问题 。 

回顾 一 下 USN 记录 仅 当 修改 发 生 在 磁盘 上 时 才 建 立 。 因 此 ，USN 记录 只 跟踪 持久 的 修 
改 ， 这 些 修改 只 是 在 文件 一 级 而 不 是 卷 一 级 被 记录 ， 通 过 一 个 字段 来 记录 实际 文件 名 ， 文 件 
名 长 度 ， 文 件 名 偏 移 量 以 及 文件 名 属性 。 这 种 方法 的 优点 是 记录 数量 直接 与 修改 数量 成 比 
例 ， 而 不 是 卷 中 的 条 目 数 。 旧 的 修改 记录 没有 4k 字 节 的 存储 单元 。 每 个 修改 日 志 包含 三 部 
分 的 标识 字段 ， 必 须 不 同 于 该 实体 原先 的 修改 日 志 标识 。 第 一 个 标识 字段 通常 总 是 存放 主 版 
本 号 ， 第 二 部 分 记录 次 版 本 号 。 用 版 本 2.01 作为 修改 记录 的 例子 ， 其 主 版 本 号 是 2， 次 版 本 
号 是 01， 这 两 部 分 标识 能 使 每 次 改变 都 是 惟一 的 标识 。 第 三 个 也 是 最 后 的 标识 字段 是 安全 
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标识 字段 。USN 记录 也 包含 一 个 时 间 惟 值 和 源 信息 。 源 信息 可 以 是 以 下 三 种 中 的 一 个 : 应 用 
程序 中 的 正常 改变 ; 存储 功能 (例如 文件 复制 ) 引起 的 存储 改变 ; 由 应 用 程序 引起 的 辅助 应 
用 程序 改变 ， 例 如 为 实现 完整 全 面 的 图 像 的 应 用 程序 功能 而 需要 产生 的 预览 链接 。 

为 了 改变 主 拷 贝 之 间 的 同步 ,复制 成 员 请 求 源 成 员 计 算 机 将 它 所 有 大 于 最 后 接收 到 的 
USN 的 修改 都 予以 更 新 。 源 计算 机 于 是 检查 它 的 目录 ， 并 用 大 于 当前 USN 的 USN 标识 每 个 
对 象 。 特 性 修改 是 逐个 地 调节 的 。 在 冲突 或 是 对 同一 特性 的 多 重 改 变 情况 下 ， 由 时 间 惟 来 决 
定 获胜 者 ， 即 最 近 修 改 的 获胜 。 由 于 时 间 惟 只 是 用 做 平局 时 的 仲裁 者 〈 因 为 没有 硬币 可 抛 
掷 )， 故 同步 不 是 重要 的 。 

最 后 一 点 ， 前 面 提 到 的 方法 是 基于 数据 的 ， 而 数据 查询 需要 99% 的 时 间 。 数 据 是 经 常 
改变 的 ， 并 且 是 易 失 性 的 。 易 失 性 信息 通常 不 存放 到 目录 中 ， 但 需 通 过 一 种 透明 的 联接 机 制 
连接 ， 以 替代 存储 在 目录 结构 中 的 信息 。 也 就 是 说 ， 易 失 性 对 象 存放 在 单独 的 采用 不 同 复制 
特性 的 存储 器 中 ， 但 仍 给 持 公 共用 户 视图 。 


12.5.3 微软 的 索引 服务 器 和 HTTP 支持 


超 文 本 传输 协议 (HTIP) 是 Intemet 的 World Wide Web (WWW) 的 标准 。Windows 2000 
的 微软 Intemet 信息 服务 器 CIS) 将 对 目录 对 象 的 请 求 翻译 成 在 任何 HTML 客户 端 都 能 看 到 
的 HTML 页面。 因此 ， 任 何 询问 和 所 有 对 象 郡 能 利用 熟悉 的 Web 浏览 模型 来 实现 。 而 且 本 
地 和 远程 资源 差异 是 最 八 化 的 ， 因 为 这 两 种 类 型 的 访问 是 以 同样 的 方法 呈现 在 用 户 面 前 的 。 
正如 我 们 多 次 提 到 的 ， 这 是 分 布 式 操作 系统 的 一 个 重要 特性 。IIS 的 一 个 部 分 是 微软 索引 服 
务 器 ， 它 的 职责 是 在 企业 intranet 和 Internet 的 站 点 上 实现 Web 类 型 的 浏览 。 索 引 服 务 器 采用 
12.4.1 节 中 描述 的 修改 日 志 。 在 本 节 中 ， 我 们 可 以 更 仔细 地 观察 索引 服务 器 以 及 它 与 Win- 
dows 2000 中 目录 的 关系 。 

微软 索引 服务 器 允许 一 种 数据 库 类 型 在 一 目录 中 访问 对 象 ， 特 别 是 它 允 许 全 文 索 引 ， 这 
种 基于 文本 的 索引 支持 下 列 类 型 查找 : 

4 查找 词 或 短语 。 

4 使 用 布尔 操作 符 查找 ， 例 如 AND，OR 和 AND NOT。 

4 使 用 统 配 符 查 找 ， 例 如 * ,? 和 正规 表达 式 。 

4 使 用 关系 限制 符 “< ,< = ,> ,= >) 查找 诸如 日 期 和 文件 尺寸 那样 的 常量 。 

4 查找 接近 其 他 字 的 字 。 

4 在 一 种 指定 的 文档 类 型 中 查找 。 

4 在 指定 类 型 文档 中 的 指定 段 中 查找 。 

4 基于 特性 的 查找 ， 例 如 作者 和 创建 日 期 。 

4 按 匹配 的 质量 排序 。 

或 许 微软 素 引 服务 器 给 人 最 深刻 印象 之 一 是 该 系统 只 需要 零 维护 ， 它 是 自动 更 新 的 ， 并 
且 包 含 自动 故障 检测 和 恢复 。 另 外 它 的 查找 能 力 集成 在 系统 安全 中 ， 因 此 查找 只 向 允许 访问 
的 进行 实例 化 查询 的 用 户 提供 它 的 文件 和 信息 。 显 然 ， 任 何 热衷 于 UNK 的 用 户 能 完成 任何 
一 个 或 所 有 上 述 这 些 任务 ， 但 无 法 应 用 如 此 简单 的 界面 。 为 了 能 以 最 低 的 开销 提供 这 些 服 
务 ， 索 引 是 在 每 个 虚拟 根 的 基础 上 被 控制 并 支持 索引 的 递增 刷新 。 最 后 ， 它 在 国际 环境 下 支 
持 下 面 七 种 语言 : 

1. Riz, 
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. 法 语 。 

德语 。 

. 西班牙 语 。 

, 意大利 语 。 

. 荷兰 语 。 

7. 瑞典 语 。 

如 果 需 要 增加 语言 支持 ， 其 他 语言 可 以 很 容易 地 通过 使 用 开放 的 规范 说 明 而 集成 进来 。 


NU pW N 


与 有 关 其 他 类 型 语言 相 适应 的 规范 说 明 现在 还 不 清楚 。 详 细 说 明 12.7 演示 了 索引 过 程 。 





详细 说 明 12.7 
索引 过 程 














索引 服务 器 并 不 时 常 对 修改 作 轮 询 而 增加 系统 资源 的 负担 ， 相反， 这 种 服务 器 已 在 | 
文件 系统 中 注册 以 获得 修改 通知 ， 并 适时 更 新 家 引 。 索引 过 程 是 四 步 过 程 ， 第 2 步 到 第 4 
步 在 图 12-7 PH. : 

1. 收集 改变 通知 ; 这 是 在 后 台 工 作 的 仅 当 资源 可 用 时 才 发 生 的 澡 靖 过 程 。 当 着 上 的 
文档 被 修改 ， 文件 系统 通知 党 引 服务 器 。 如 果 能 使 用 资源 ， 且 不 会 影响 系统 的 性 能 时 ， 
索引 服务 器 就 打开 文档 并 开始 索引 过 程 。 利 用 操作 系统 来 收集 修改 通知 要 比 传统 的 办 
方法 具有 更 好 的 可 扩展 性 。 2 

2.28: PELE OTR RBAHLHBS, ASGRSL HRA HH RK 
据 类 型 的 程序 员 使 用 开放 标准 Filer BOARN. R, MRANA Word LE ARTE 
器 。 过渡 系统 打开 次 件 ， 随后 选择 并 且 用 合适 的 内 容 过 滤器 。 提 取 文 本 的 语 段 并 送 到 下 
一 步 。 索 引 过 沾 器 也 能 够 处 理 几 入 对 象 ， 人 鲁 如 图 形 、 电 子 表格 ， 以 及 包含 在 其 中 的 文本 。 
最 后， 过 湾 进 程 能 铝 为 了 息 递 信息 对 文本 进行 标记 ， 例 如 文 机 分 央 所 使 用 的 语 着。 

3. MPH: 字符 流 从 过 滤 过 程 输出 必须 分 割 成 词 ， 这 是 对 计算 机 来 说 比 对 人 类 更 加 
困难 的 任务 。 对 于 许多 语言 ， 例 如 英语 可 利用 空格 来 分 割 词 ， 而 其 他 语言 ， 例 如 日 文 ， 
HEER, A, RRIT  FHRLAR AMMAR TM, REHANA Uni 
code 表 示 和 存储 的 。 

4, 规格 化 : 规格 化 过 程 用 来 清理 词 。 AMBLER BALE, BRAS RRP, LH 
就 可 使 词 一 旦 要 存放 到 索引 中 时 就 有 统一 的 表示 。 通 常 虚 字 包 仿 “ 无 用 的 ”或 无 意 头 的 
他, 例如 he，of 和 and 等 。 REHM MT RAG EER, 并 使 处 理 按 规格 定制 。 
PERE SMMAA THEE | 
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12.6 微软 管理 控制 台 


内 部 代码 命名 为 Slate 的 微软 管理 控制 台 (MMC) 设计 为 Windows NT 4.0 及 以 上 版 本 的 
管理 应 用 程序 而 提供 的 一 个 公用 框架 。 当 没有 提供 实际 的 任何 管理 应 用 程序 时 ，MMC 提供 
一 个 公共 环境 和 稳定 的 接口 给 “插件 ”管理 应 用 程序 ， 并 使 它们 无 颖 地 集成 到 系统 中 ， 这 是 
Windows 软件 开发 工具 第 (SDK) 的 一 部 分 。 有 了 MMC， 可 以 将 多 个 较 小 的 工具 集合 生成 小 
型 工具 。 每 个 工具 就 是 所 谓 的 插件 ， 因 此 可 以 方便 地 扩充 和 分 层 组 织 。 最 后 形成 的 工具 通常 
用 来 管理 一 类 资源 ， 例 如 一 个 网 络 。 当 然 ， 每 个 建立 的 工具 可 存储 起 来 以 供 将 来 使 用 和 参 
考 。 而 当 人 允许 建立 多 个 工具 时 ， 管 理 者 只 需要 在 某 一 时 刻 建 立 实 际 需要 的 工具 ， 可 印 下 当时 
不 需要 的 任何 其 他 的 工具 。 它 也 可 邮寄 一 个 工具 定义 给 其 他 管理 者 。 当 第 二 个 管理 者 收 到 该 
工具 的 时 候 ， 所 有 需要 的 插件 会 自动 地 下 载 和 安装 。 

下 面 列 出 管理 者 使 用 MMC 的 四 个 好 处 : 

1. 面向 任务 : MMC 中 定义 的 工具 是 面向 任务 的 。 管 理 者 可 以 使 用 来 自 不 同 厂商 的 工具 
来 创建 他 们 自己 的 工具 , 这 些 工具 都 是 针对 江 显示 了 面向 任务 的 信息 ， 而 不 是 用 未 处 理 的 对 
象 来 表示 。 

2. AR: 利用 单一 控制 台 来 收集 由 某 一 管理 员 必 须 执 行 的 所 有 任务 。 用 户 接口 将 所 有 
新 增加 的 应 用 集成 到 已 有 的 控制 台 上 。 | 

3. Ki: MMC 有 能 力 使 已 存在 的 工具 经 修改 后 创建 功能 降低 的 并 且 复 杂 性 也 减低 的 新 
工具 。 这 些 较 简单 的 工具 能 传送 给 其 他 的 个 人 ， 于 是 接收 工具 的 个 人 可 以 完成 他 们 的 杂 务 ， 
即 可 以 使 用 更 简单 、 更 易 管 理 的 工具 完成 他 们 的 任务 。 

4. 接口 简单 化 : 所 有 由 MMC 建立 的 工具 有 相似 的 外 观 和 感觉 ， 而 无 论 开发 这 些 工具 的 
厂商 是 哪 一 家 。 从 统计 和 角度 讲 ， 应 该 降低 学 习 任何 新 的 MMC 工具 的 能 力 曲 线 。 另 外 ， 应 能 
使 用 户 选 择 或 组 合 来 自 不 同 厂商 的 具有 一 致 功能 的 MMC 工具 。 后 者 是 在 建立 和 采用 统一 的 
API 时 具有 的 共同 优点 。 

虽然 对 管理 者 是 透明 的 ， 所 有 MMC 插件 支持 下 面 两 种 可 能 的 模式 中 的 一 种 或 两 种 。 

1. 独立 插件 ; 这 种 类 型 的 插件 功能 独立 ,不 需要 任何 类 型 的 插件 支持 ， 不 依赖 于 任何 
的 其 他 插件 。 

2. 扩充 插件 ; 这 各 类 型 的 插件 只 能 在 双亲 插件 调用 它 时 才 提 供 功 能 。 它 可 作为 一 个 专 
门类 型 插件 的 从 属 类 型 ， 且 每 一 次 出 现时 均 是 此 类 型 。 

如 果 一 个 播 件 支持 两 种 模式 ， 则 它 包 含 某 些 独 立 的 功能 ， 它 就 可 以 独立 工作 ， 同 时 也 具 
有 可 选 的 功能 ， 扩 展 了 已 有 的 插件 。 如 果 已 有 的 插件 没有 出 现在 给 定 环境 中 ， 则 扩充 功能 的 
TE (也 只 有 该 子 集 ) 是 不 能 提供 的 。 例 如 ， 一 个 打印 机 标记 插件 可 以 在 两 种 模式 下 工作 。 
如 果 系 统 存 有 一 张 定义 过 的 打印 机 的 列表 ， 该 打印 机 标记 插件 将 在 定义 过 的 打印 机 上 使 用 扩 
充 模 式 工作 。 然 而 ， 如 果 没 有 定义 的 打印 机 ， 该 插件 就 在 独立 模式 下 工作 ， 同 时 需要 管理 者 
输入 定义 的 打印 机 集合 ， 这 是 该 插件 所 期 望 的 。 详 细 说 明 12.8 描述 了 可 能 使 用 的 不 同 插件 
扩充 类 型 的 一 些 例子 。 

微软 鼓励 所 有 开发 商 使 用 MMC 建立 的 一 系列 管理 工具 ， 实 际 上 它 提供 了 用 MMC 的 工具 
集 去 集成 非 MMC 的 工具 的 方法 。 尤 其 是 可 以 在 .MSC 文件 中 建立 并 存储 非 MMC 工具 集 的 快 
捷 方式 。 于 是 管理 者 能 使 用 MMC 的 .MSC 文件 建立 对 这 些 非 MMC 工具 的 任何 可 执行 程序 的 
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详细 说 明 12.8 
MMC 扩充 类 型 











“下面 是 可 用 的 MMC 扩充 类 型 的 示例 

了 名 字 空 间 枚 举 ， 这 种 扩充 类 型 在 一 个 结 上 中 操作 。 结 点 定义 为 一 个 可 管理 的 任务 
或 对 象 ， 例 如 一 台 计 算 机 或 Web 页 的 集合 。 ek wk waterside 
序列 表 。 名 字 空 间 格 式 化 成 一 樟树 。 

2 工具 条 和 工具 条 批 钮 ，; LEP LAME LAM TAK. RALL be TAR 
Bo MAP LTAR STARMAN ETT, 或 是 在 一 个 已 有 的 工具 条 中 加 入 一 个 按钮 。 

3. He: 这 种 扩充 类 型 用 于 给 定 的 结 志 或 对 象 ， 将 一 些 项 目 加 入 到 “建立 新 菜单 " 
BNP, A-BAT ERD “Create new” 484. 





快捷 方式 。 
12.7 集群 服务 


集群 经 常 指 多 个 独立 系统 的 集合 ， 可 发 挥 资源 群 协同 工作 的 优点 ， 能 比 任何 单独 子 系统 
提供 更 好 的 服务 。 为 了 达到 实用 的 目的 ， 集群 必须 容易 实现 、 编 程 和 管理 。 理 想 情 况 下 ， 所 
有 的 客户 映 应 用 程序 应 能 与 集群 交互 ， 并 把 它 看 做 是 一 个 简单 的 、 独 立 的 服务 器 。 其 优点 是 
提高 了 可 靠 性 和 容错 性 。 有 时 集群 中 的 独立 子 系统 要 比 非 集群 类 型 便宜 得 多 ， 所 以 整个 集群 
的 费用 不 像 一 些 人 想象 的 那么 高 。 当 然 ， 实 际 费 用 取决 于 选用 怎么 样 的 设备 放 人 集群 中 。 
12.7.1 节 给 出 了 微软 Windews 2000 操作 系统 集群 服务 的 概况 ， 它 是 Windows 2000 服务 器 的 一 
部 分 。12.7.2 节 展 示 了 不 同 集群 的 抽象 ，12.7.3 节 集 中 说 明 集 群 服务 的 体系 结构 ，12.7.4 
节 则 论述 应 用 领域 的 情况 。 


12.7.1 集群 服务 概况 


微软 的 集群 服务 首先 是 在 Windows NT 4.0 操作 系统 中 出 现 。 它 在 微软 的 白皮书 系列 
[ Micr98] 和 [GaShMa98] 中 进行 了 说 明 。 在 Windows 2000 的 实现 中 包含 了 一 种 “向 导 ” 来 帮 
助 建立 集群 及 其 特性 ， 对 大 于 第 6 章 中 叙述 的 COM 和 DCOM 的 已 有 服务 或 应 用 环境 的 集成 
提供 了 很 大 的 改进 。 

集群 服务 设计 成 一 种 为 可 扩展 的 容错 环境 提供 方便 的 接口 。 集 群 服务 极 大 地 依 束 于 RPC 
机 制 Windows 2000 名 字 管 理 、 网 络 接口 管理 、 安 全 性 、 资 源 控制 和 文件 系统 。 为 了 提供 简 
化 的 接口 ，Windows 2000 集群 服务 采用 了 12.7.2 节 中 描述 的 抽象 。 可 扩展 的 容错 结构 在 
12.7.3 节 中 说 明 。 应 用 服务 中 能 采用 集群 服务 优点 的 方法 将 在 12.7.4 节 中 叙述 。 某 些 传统 
的 集群 特性 包括 容错 的 应 用 支持 ， 状 态 恢复 和 常量 迁移 等 ， 虽 然 当 前 在 Windows 2000 集群 服 
务 中 还 没有 提供 ， 但 已 在 “GasShMa98] 中 承诺 ， 希 望 在 不 远 的 将 来 能 提供 支持 。 


12.7.2 集群 抽象 


将 Windows 2000 操作 系统 中 集群 服务 的 抽象 设计 成 有 利于 系统 管理 员 、 用 户 和 集群 服务 
自身 。 正 如 [GaShMa98] 中 描述 的 ， Windows 2000 集群 服务 采用 了 一 些 抽象 ， 包 括 资源 、 资 
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源 依赖 性 、 资 源 组 和 虚拟 Windows 2000 服务 器 抽象 。 资 源 抽象 是 集群 中 管理 的 基本 单元 。 有 
两 种 基本 的 预定 义 资 源 类 型 : 物理 资源 和 逻辑 资源 。 物 理 资源 的 例子 是 一 种 小 型 的 计算 机 系 
SEO (SCSI, RAH scuzy) 磁盘 ， 而 作为 逻辑 资源 的 例子 是 一 个 耳 地 址 。 附 加 的 资源 类 
型 及 其 相关 的 控制 库 〈 例 如 DLL) 可 由 应 用 开发 者 加 到 集群 中 ， 这 样 就 能 扩展 集群 的 能 力 。 
这 里 不 关心 精确 的 资源 类 型 ， 因 为 资源 分 类 的 目的 是 能 使 已 有 的 应 用 最 大 程度 地 使 用 集群 服 
务 。 主 要 是 每 个 资源 的 接口 必须 是 相同 的 ， 从 而 使 所 有 资源 易于 监控 和 管理 。 

资源 依赖 性 抽象 利用 一 标 依 赖 树 来 描述 ， 并 定义 集群 中 的 初始 服务 序列 ， 后 者 经 常 称 为 
起 始 服务 。 例 如 ， 有 一 个 实现 对 象 代理 的 资源 ， 就 像 CORBA 环境 中 采用 的 一 样 ， 必 须 先 于 
其 他 服务 启动 ， 而 其 他 服务 需要 与 对 象 代理 通信 并 完成 一 个 任务 。 该 依赖 性 与 下 面 的 电话 例 
子 均 采用 同样 的 逻辑 。 具 体 地 说 ， 希 望 通信 的 各 部 分 之 间 的 连接 必须 在 通信 之 前 建立 ， 这 样 
会 话 就 取决 于 已 建立 的 通信 和 连接。 依赖 树 也 用 来 说 明和 定义 服务 必须 关闭 的 顺序 ， 即 通常 称 
之 为 终止 或 关闭 的 顺序 。 依 赖 树 也 包含 在 集群 中 迁移 一 个 资源 到 其 他 位 置 时 必须 维持 的 资源 
子 集 组 所 需要 的 有 关 信 息 。 一 个 普通 位 置 依赖 性 的 例子 是 数据 库 和 用 来 存储 该 数据 库 的 
磁盘 。 

资源 组 的 抽象 能 使 资源 整合 成 较 大 的 逻辑 单元 ， 这 种 抽象 有 利于 资源 管理 。 通 常 ， 将 能 
执行 应 用 程序 的 全 部 功能 的 相关 资源 整合 在 一 起 ， 组 织 成 一 个 资源 组 。 这 样 的 组 在 各 种 方法 
中 作为 单一 的 单元 来 管理 ， 如 果 组 中 的 单个 实体 失效 ， 那 么 整个 组 就 会 失效 。 另 一 种 组 可 标 
识 为 失效 一 恢复 组 ， 这 个 新 组 必须 能 支持 失效 组 中 的 每 一 个 设备 。 精 确 的 资源 集 和 资源 依赖 
树 是 由 集群 管理 员 按 组 指定 。 另 外 ， 管 理 员 有 责任 制定 失效 一 恢复 策略 ， 包 括 设置 重新 启动 
一 个 组 的 延迟 时 间 以 及 何 时 服务 应 用 会 返回 〈 作 为 失效 一 返回 窗口 )， 以 及 组 的 优先 属 主 结 
点 表 等 。 

最 后 的 抽象 是 虚拟 Windows 2000 服务 器 抽象 ， 这 种 抽象 将 服务 和 提供 给 指定 服务 的 所 有 
需要 的 资源 封装 在 一 起 。 通 常 使 用 集群 服务 来 配置 的 服务 是 文件 服务 器 、 数 据 库 Web 服务 
器 email 服务 器 和 其 他 标准 的 每 日 商务 操作 服务 器 等 。 对 每 一 虚拟 服务 器 来 讲 ， 网 络 名 和 
地 址 对 所 有 客户 都 是 可 见 的 。 这 些 信息 不 因 和 集群 中 的 修改 而 改变 ， 因 而 对 所 有 客户 、 应 
用 程序 和 管理 者 提供 了 一 种 单一 稳定 的 环境 怀 受 。 


12.7.3 集群 服务 体系 结构 


从 物理 方面 来 讲 ， 一 个 集群 可 由 经 以 太 网 连接 成 的 个 人 计算 机 组 成 ， 也 可 由 高 性 能 超级 
计算 机 组 成 。 无 论 哪 种 情况 ， 集 群 提供 了 容错 、 可 靠 性 和 单一 服务 器 或 单一 系统 的 功能 。 通 
过 容错 ,集群 服务 能 检测 和 重新 启动 失效 的 硬件 和 软件 部 件 。 如 果 一 个 失效 部 件 不 能 恢复 ， 
该 部 件 的 功能 就 迁移 到 集群 的 另 一 个 部 件 。 失 效 一 恢复 组 的 备份 部 件 提供 了 可 靠 性 。 不 论 是 
由 于 集群 的 需要 或 是 由 于 失效 一 恢复 操作 引起 的 工作 负载 ， 通 常 对 集群 是 透明 的 ， 于 是 进 一 
步 加 深 了 单个 服务 器 的 感觉。 

通常 有 两 种 软件 模型 用 于 集群 技术 : 公共 资源 模型 和 独立 资源 模型 。 两 种 模型 能 在 单一 的 
Windows 2000 集群 中 得 到 支持 。 一 般 来 说 ， 希 望 有 最 大 的 可 扩展 性 的 应 用 程序 ， 应 该 采用 独立 
资源 模型 。 如 果 工 作 负 载 难于 分 散 ， 则 经 常 采 用 公共 资源 模型 。 现 在 来 说 明 这 两 种 模型 。 

公共 资源 模型 允许 -一 个 资源 中 的 系统 去 访问 集群 中 与 任何 系统 连接 的 任何 资源 ， 因 此 ， 
集群 中 的 所 有 资源 都 能 相互 访问 。 集 群 中 公共 资源 的 一 个 例子 是 系统 磁盘 ， 它 可 被 集群 中 其 
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他 的 人 访问 。 为 了 防止 潜在 的 冲突 ， 确 保 数据 和 操作 的 完整 性 ， 共 享 内 存 ( 见 第 4 章 ) 要 遵 
循 某 种 类 型 的 并 发 控制 ( 见 第 5 章 ) 和 /或 采用 事务 管理 〈 见 第 9 章 )。 

独立 资源 模型 只 允许 一 个 系统 在 某 一 时 刻 拥 有 和 和 访问 一 个 给 定 的 资源 ， 除 非 拥 有 者 失 
效 。 在 拥有 者 失效 的 情况 下 ， 集 群 中 的 另 一 系统 可 以 动态 地 成 为 拥有 者 。 所 有 对 集群 中 具体 
服务 的 请 求 会 自动 地 送 往 所 需 资源 的 当前 拥有 者 。 如 果 某 一 客户 端 需要 集群 服务 器 执行 一 个 
需要 访问 多 个 资源 的 任务 ， 选 定 集群 中 的 一 个 部 件 为 该 请 求 的 宿主 ， 此 宿主 随后 将 该 请 求 分 
解 为 多 个 子 请 求 并 做 适当 的 分 布 处 理 ， 宿 主 再 收集 各 部 分 的 响应 并 汇总 成 集群 的 响应 。 

前 面 提 到 Windows 2000 允许 每 个 集群 使 用 任 一 模型 ， 或 者 两 个 模型 一 起 使 用 。 基 本 配置 
信息 通常 是 保存 在 注册 表 一 一 一 个 本 地 数据 库 中 。 在 集群 系统 的 情况 下 ， 采 用 集群 范围 的 注 
册 表 是 为 了 允许 每 个 集群 服务 以 及 应 用 程序 获得 一 个 统一 的 关于 资源 状态 和 当前 集群 配置 的 
全 局 视图 。 所 有 注册 表 的 更 新 都 是 自动 完成 的 ， 采 用 一 种 自动 更 新 协议 。 


12.7.4 为 应 用 程序 配置 的 集群 服务 


有 两 种 方法 提供 给 采用 基于 集群 服务 的 应 用 程序 。 第 一 种 方法 中 应 用 知道 服务 是 基于 集 
群 的 服务 ， 第 二 种 方法 不 知道 有 集群 存在 。 知 道 服务 是 使 用 基于 集群 的 应 用 的 方法 经 常 称 为 
惯例 应 用 [GaShMa98]。 惯 例 应 用 并 不 需要 修改 应 用 ， 但 要 开发 一 个 集群 接口 层 , 该 层 应 用 
于 管理 和 响应 失效 。 因 此 ， 惯 例 应 用 可 显 式 地 获得 集群 自动 失效 一 恢复 的 优越 性 ， 它 通过 惯 
用 资源 DLL 检测 故障 。 另 外 ， 这 些 接口 提供 了 启动 和 停止 集群 中 给 定 资源 的 能 力 ， 以 及 监 
控 每 个 资源 是 否 可 操作 。 这 样 ， 对 惯例 应 用 控制 的 颗粒 度 的 级 别 将 大 大 增加 。 

不 是 所 有 应 用 都 需要 成 为 惯例 应 用 ， 也 可 以 是 类 属 应 用 ， 这 种 类 属 应 用 不 需要 经 历 对 集 
群 服务 操作 的 任何 修改 。 惯 例 应 用 中 控制 和 监控 的 颗粒 度 级 别 不 会 有 很 大 变化 ， 因 此 ， 可 靠 
性 和 失效 检测 就 比较 原始 了 。 失 效 检 测 不 能 在 集群 中 的 单个 服务 中 实施 ， 而 通常 通过 检查 进 
程 的 状态 来 实现 。 一 个 挂 起 的 应 用 程序 并 不 是 一 直 可 以 检测 到 的 ， 如 果 对 类 属 应 用 需要 更 复 
杂 的 失效 检测 机 制 ， 则 通常 应 实现 一 个 惯用 资源 DLL。 


12.8 Windows 2000 安全 性 


正如 第 11 章 中 讨论 的 ， 所 有 现代 操作 系统 必须 在 许多 层次 上 是 安全 的 。Windows 2000 
对 下 列 的 工业 标准 和 安全 协议 提供 了 全 方位 的 支持 : 

1，Diffie 一 Hellman 密 铀 交换 。 

2. 数字 签名 ， 专 门 的 hash 消息 认证 代码 ， 例 如 MDS, SHA 和 CBC, 

3. Kerberos 认证 协议 。 

4. SSL. 

5. WAM, TlH DES, 

除了 这 些 工 业 标准 以 外 ，Windows 2000 还 提供 了 三 种 其 他 的 密 钥 安全 特性 ， 本 章 将 研究 
这 些 特性 。12.8.1 节 研 究 安 全 配置 编辑 器 ，12.8.2 节 给 出 加 密 文件 系统 ，12.8.3 节 说 明 微 
软 安全 支持 提供 者 接口 。 


12.8.1 安全 配置 编辑 器 
微软 安全 配置 编辑 器 是 :一 种 MMC 插件 工具 。 这 种 单独 的 工具 设计 成 能 帮助 定义 、 管 理 





319 


320 


321 


216 分 布 式 操作 系统 :; 原理 与 实践 





和 验证 基于 Windows 2000 的 系统 的 安全 配置 ， 并 且 采 用 了 成 本 -效益 的 方法 。 该 工具 在 Win- 
dows 2000 环境 下 特别 有 用 ， 因 为 为 了 提高 对 企业 级 分 布 式 计算 的 支持 ， 管 理 安全 配置 的 复 
杂 性 将 大 大 增加 。 该 工具 并 不 意味 着 去 替代 用 户 管理 、 服 务 器 管理 和 访问 控制 表 编辑 器 ， 而 
是 补充 这 些 工具 的 功能 。 一 般 需 要 的 操作 应 能 自动 地 在 后 台 执行 。 在 表 12.2 中 列 出 的 安全 
特性 ， 可 通过 安全 配置 编辑 器 来 配置 和 分 析 。 

安全 配置 编辑 器 的 一 个 有 用 的 特性 是 它 定义 和 使 用 安全 配置 模板 的 能 力 。 这 些 模板 可 包 
含 安全 属性 的 设置 ， 能 在 于 安全 的 任何 方面 ， 其 至 管理 者 可 对 基于 某 一 类 基础 模板 的 企业 系 
统 进行 分 析 。 当 然 ， 这 样 的 基础 模板 既 可 以 是 Windows 2000 中 的 默认 模板 集 ， 也 可 以 是 由 管 
理 者 为 企业 定义 的 用 做 推荐 模板 的 模板 集 。 这 些 模 板 是 标准 的 基于 文本 的 .inf 文件 。 每 当 一 
个 模板 被 安装 ， 安 全 配置 编辑 器 的 配置 引擎 切 分 该 模板 并 使 系统 作出 相应 的 改变 。 通 过 该 编 
辑 器 ， 管 理 者 也 能 从 一 个 已 存在 的 系统 创建 一 个 模板 。 


表 12-2 SCE 配 置 的 安全 特性 
安全 性 能 说 明 
该 编辑 器 允许 设置 访问 策略 ， 包 括 如 何 和 何 时 用 户 能 登录 系统 、 口 令 策略 、 整 个 系统 








系统 安全 策略 对 象 安全 、 审 查 设置 和 域 策略 

用 户 账 户 编辑 器 辅助 设置 组 成 员 ， 特 权 以 及 用 户 权 限 

系统 服务 编辑 器 能 配置 已 安装 的 不 同 服务 ， 包 括 网 络 、 文 件 共享 和 打印 
系统 注册 编辑 加 能 在 系统 注册 表 中 采用 一 系列 安全 信 

系统 存储 编辑 器 能 给 本 地 系统 文件 卷 和 目录 树 设置 安全 功能 

目录 安全 编辑 闫 可 用 来 管理 Window 2000 活动 目录 中 对 象 的 安全 

有 五 种 微软 认定 的 基本 安全 领域 。 


1. 安全 策略 : 这 些 策略 适用 于 各 种 本 地 的 和 域 的 安全 策略 属性 ， 包 括 机 器 层 设 置 。 
Windows 2000 中 的 域 定义 为 一 种 物理 安全 边界 。 策 略 包括 可 采用 的 口令 类 型 、Kerberos 票据 
生存 期 、 账 户 封锁 等 。 

2. 受 限 组 管理 : 该 功能 由 系统 管理 员 用 在 由 敏感 的 成 员 构 成 的 组 中 ， 一 般 的 受 限 组 包 
括 打印 机 操作 员 ， 服 务 器 操作 员 ， 电 源 用 户 等 等 。 组 的 分 析 不 仅 依 据 简单 的 成 员 关 系 ， 而 且 
可 以 是 递归 的 成 员 关 系 。 

3. 权限 和 特权 管理 : 该 领域 属于 用 户 和 组 的 管理 ， 用 户 和 组 的 管理 授予 系统 中 专门 的 
权限 和 特权 。 该 领域 包括 指定 可 信任 域 和 组 的 能 力 ， 它 们 也 可 在 本 地 机 器 上 部 有 权限 和 
特权 。 

4. 对 象 桂 : 该 领域 包括 目录 对 象 ， 注 册 键 和 本 地 文件 系统 。 安 全 编辑 器 允许 配置 对 象 
拥有 关系 ， 访 问 控制 表 以 及 审查 信息 等 。 对 于 目录 对 象 ， 管 理 者 可 以 利用 安全 描述 定义 语言 
(SDDL)， 它 用 来 完成 具有 资格 的 LDAP 名 字 列 表 和 每 个 名 字 的 安全 描述 符 的 完全 说 明 。 有 资 
格 的 完整 注册 键 路 径 和 使 用 SDDL 格式 的 安全 描述 符 可 用 来 控制 注册 表 对 象 。 文 件 系统 安全 
性 采用 动态 继承 模型 ，NIFS 也 支持 此 模型 。 给 定 系 统 的 所 有 卷 作为 单一 的 树 处 理 。 

5. 系统 服务 : 该 领域 包括 所 有 本 地 和 网 络 系统 服务 。 这 个 领域 设计 成 可 扩充 的 ， 可 以 
包含 诸如 文件 和 打印 服务 ， 电 话 和 传真 服务 以 及 Internet/intranet 服务 的 各 类 服务 ， 此 类 目录 
中 的 最 重要 的 限制 是 在 该 安全 配置 编辑 器 中 使 用 服务 的 名 字 ， 需 要 与 服务 控制 管理 器 中 使 用 
的 一 致 。 
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额外 的 领域 可 通过 MMC 择 件 加 入 ， 不 需要 打破 与 已 有 模板 的 向 后 兼容 性 。 对 每 一 个 这 
样 的 领域 ， 系 统管 理 员 能 通过 图 形 用户 界 面 (GU) 来 定义 ， 配置， 分 析 和 观察 安全 数据 。 
也 能 通过 一 种 有 限 命令 行 的 实用 程序 来 做 配置 和 分 析 。GUI 接口 是 非常 容易 使 用 的 ， 因 此 推 
荐 使 用 它 。 例 如 ， 当 执行 分 析 时 ， 当 前 的 设置 在 推荐 设置 模板 的 下 面 显 示 。 颜 色 ， 字 体 ， 图 
标的 使 用 可 用 来 帮助 标识 存在 潜在 问题 的 领域 ， 且 能 用 鼠标 的 点 击 来 进行 修正 。 此 外 ， 以 前 
的 设置 也 记录 在 事件 中 ， 可 恢复 成 原来 的 设置 。 

有 了 安全 配置 编辑 器 ， 尖 于 Windows 200 的 系统 有 两 种 模式 的 安全 分 析 。 第 一 种 模式 称 
为 已 配置 系统 分 析 。 这 种 操作 模式 是 指 对 由 配置 模板 配置 好 的 ， 而 不 是 按 事先 分 析 得 到 的 性 
能 来 配置 的 系统 进行 分 析 ， 分 析 利 用 已 建立 的 数据 库 作为 这 些 模板 的 结果 。 第 二 种 安全 分 析 
模式 称 为 未 配置 系统 分 析 ， 这 种 操作 模式 是 将 系统 与 基 模 板 进行 比较 的 分 析 。 基 模板 用 于 比 
较 分 析 的 全 过 程 ， 且 与 数据 让 输出 一 起 存储 ， 用 于 以 后 的 分 析 。 道 过 改变 基 模 板 和 安全 配置 
编辑 器 中 的 重 配置 选项 ， 管 理 员 可 更 新 系统 设置 ， 


12.8.2 加 密 文件 系统 


加 密 文件 系统 (EFS) 包含 在 Windows 2000 操作 系统 的 核心 部 分 。 由 于 分 布 式 系统 的 部 
件 是 连接 到 网 络 的 ， 可 能 是 Intemet。 一 旦 安全 泄漏 的 事件 发 生 ， 所 有 文件 都 以 加 密 格式 存 
储 是 非常 有 益 的 。Windows 2000 的 EFS 采 用 了 非 对 称 和 对 称 加 密 。EFS 指定 的 步骤 如 下 : 

1. 用 户 的 明文 文件 使 用 随机 生成 的 文件 密 钥 (FEK) 加密 。FEK 采用 对 称 加 密 。 当 前 ， 
Windows 2000 选择 的 私 钥 技术 是 DES， 但 以 后 推出 的 EFS 版 本 允许 替代 现 有 的 加 密 方法 。 

2. FEK 密 钥 作 为 属性 存储 在 文件 中 。 具 体 地 说 : 它 是 存储 在 使 用 用 户 公 钥 解 密 的 数据 
解密 区 域 中 ， 以 及 使 用 恢复 密 钥 的 数据 区 域 中 ， 如 图 12-8 所 示 。 如 果 文 件 属于 多 个 用 户 ， 
则 数据 解密 区 域 为 每 个 文件 拥有 者 配备 一 个 加 密 FEK AH. 

3. 为 了 让 用 户 解 密 文件 ， 采 用 用 户 私 钥 检索 FEK， 随 后 利用 FEK 来 得 到 文件 的 内 容 。 
数据 恢复 区 域 的 使 用 将 在 后 面 详 细 讨论 。 解 密 可 一 块 一 块 地 执行 ， 只 有 物理 地 访问 专门 的 块 
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图 12-8 EFS 加密 过 程 


GUI 环境 中 提供 EFS 能 力 ， 通 过 Windows 2000 Explorer 菜单 内 容 以 及 命令 提示 符 实施 。 
而 管理 人 员 不 需要 介 人 去 启动 对 文件 的 加 密 。 如 果 用 户 没 有 公共 密 钥 对 ，EFS 为 用 户 自动 生 
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成 一 个 。 如 果 目 录 标 记 为 加 密 ， 所 有 文件 和 子 目 录 自 动 地 被 加 密 。 每 个 文件 有 惟一 的 加 密 密 
钥 去 帮助 和 保证 合适 的 更 名 操作 。 每 当 一 个 文件 被 加 窗 ， 尽 管 该 文件 已 更 名 或 移 至 一 个 未 加 
加 密 标记 的 目录 中 ， 它 仍 将 保持 加 密 状 态 。 

如 果 用 户 没有 某 一 文件 的 私 钥 ， 则 将 被 拒绝 访问 该 文件 。 如 果 没 有 Windows 2000 操作 系 
统 ， 整 个 访问 文件 机 构 的 机 制 将 是 失调 的 。 因 此 ， 该 方案 防止 了 通过 重新 启动 一 个 不 同 的 操 
作 系 统 ， 从 而 绕 过 本 系统 安全 性 防护 设施 而 遭受 攻击 。 

EFS 作为 一 种 集成 的 系统 服务 来 运行 ， 可 使 它 易于 管理 且 难 以 攻击 。EFS NTFS 紧密 
集成 ， 加 密 文件 的 所 有 临时 拷贝 也 都 是 加 密 的 ， 这 种 能 力 能 扩展 到 远程 文件 服务 ， 但 EFS 
只 对 磁盘 上 的 数据 进行 加 密 。Windows 2000 操作 系统 提供 的 网 络 协议 ， 与 在 第 11 章 中 描述 
的 SSL/PCT 相 比 ， 只 能 用 来 对 在 整个 网 络 中 传输 的 数据 进行 加 密 。 

在 商业 环境 中 ， 一 名 雇员 可 能 不 通知 公司 就 终止 其 工作 合同 ， 公 司 就 需要 一 种 安全 系统 
能 在 它 的 资源 中 访问 该 谋 员 的 信息 。Windows 2000 操作 系统 通过 包含 在 数据 恢复 分 区 内 的 内 
A, JA EFS 提供 内 在 的 数据 恢复 支持 。 恢 复 能 力 应 在 域 管 理 员 的 控制 之 下 ， 但 也 能 指派 给 
指定 的 数据 安全 管理 员 ， 以 提供 更 好 的 控制 性 和 灵活 性 。 实 际 的 恢复 能 力 通过 恢复 密 钥 提 
供 ， 它 是 在 每 一 域 的 域 控制 器 上 定义 的 。 一 个 给 定 的 系统 能 配置 多 个 恢复 密 钥 ， 存 储 在 数据 
恢复 分 区 中 。 在 恢复 过 程 中 ， 只 有 系统 的 私 钥 需要 用 来 恢复 FEK， 因 此 不 会 泄漏 其 他 的 私有 
信息 〈 如 用 户 私 钥 )。 


12.8.3 微软 安全 支持 提供 者 接口 


微软 安全 支持 提供 考 接口 (SP) 是 一 个 定义 良好 的 API， 能 访问 身份 认证 ， 消 息 整 合 ， 
私密 消息 以 及 分 布 式 应 用 中 的 安全 质量 服务 。SSPI 可 按 一 种 或 两 种 方式 使 用 。 第 一 种 方式 ， 
SSPI 可 通过 应 用 接口 直接 用 于 诸如 DCOM (第 6 章 ) 、 安 全 RPC、WinSock 2.0 和 Winknet 等 服 
务 。 我 们 首先 研究 一 个 SPI 的 API 及 其 附带 软件 包 的 能 力 。 

SSPI 由 四 个 基本 的 API 组 所 组 成 。 第 一 组 API 是 证 书 管理 API， 这 一 组 的 接口 提供 了 和 赁 
证 的 访问 权 ， 如 口令 ， 安 全 票据 等 。 给 出 的 证 书 管理 API 如 表 12-3 所 示 。 


表 12-3 和 凭证 管理 API 
API 名 称 说 明 














AcquireCredentialsHandle 需要 一 个 指向 引用 和 凭证 的 句柄 
FreeCredentialsklandle 此 方法 释放 凭证 及 其 有 关 资 源 
QueryCredential Attributes 此 方法 允许 查询 凭证 属性 ， 如 关联 名 和 域名 


第 二 组 SSPI API 是 内 容 管理 API。 内 容 管理 提供 了 建立 和 应 用 各 种 安全 文本 的 方法 ， 无 
论 是 在 服务 器 方 或 客户 方 建立 。 内 容 管理 AFI 如 表 12-4 所 示 。 

第 三 组 SSPI API 是 消息 支持 API。 这 些 API 提供 了 通信 集成 和 私有 服务 ， 消 息 支持 API 
在 表 12.5 中 展示 。 

第 四 组 即 最 后 一 组 SSPI API 是 包 管 理 API。 这 些 API 能 访问 不 同 的 安全 包 ， 各 安全 包 是 
由 指定 的 安全 提供 者 支持 的 。 包 管理 AP 如 表 12-6 所 示 。 

进一步 对 SSPI APL 的 扩充 是 为 加 密 技术 规划 提供 消息 支持 的 程序 。 一 般 说 来 ，SSPI 允许 
使 用 各 种 安全 软件 包 而 不 需要 改变 安全 服务 接口 。 通 过 SSPI 管理 功能 ， 应 用 程序 可 列 出 和 
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选择 一 个 安全 软件 包 来 支持 它 的 需求 。 安 全 提供 者 是 一 个 动态 连接 库 用 来 实现 SSP SSPI 使 
一 个 或 多 个 安全 包 对 应 用 程序 可 用 ， 并 使 该 安全 包 的 SSPI 功能 与 给 定 的 安全 协议 的 实现 相 
映射 ， 例 如 Kerberos 或 SSL。 包 的 实际 名 称 是 在 标记 该 指定 包 的 初始 化 过 程 中 采用 的 。 


12-4 内 容 管理 API 





API 名 称 说 明 

InitislizeSeourityCortext: 该 APL 用 于 生成 一 个 安全 令 牌 来 初始 化 某 一 安全 内 容 ， 该 令 牌 被 认为 是 一 
种 能 送 到 服务 器 的 不 透明 的 消息 

AcceptSecurityContext 该 API ALAR ASF ag be BS ANE I OR ER SA 

DeleteSecurityContext 该 API 释放 安全 内容 和 所 有 相关 联 的 资源 

QueryContext Attributes 该 APL 允许 查询 各 种 内 容 属性 

ApplyControlToken 该 API 使 用 一 个 附加 的 安全 信息 到 已 有 的 安全 内 容 中 

CompleteAuthToken 为 DCE RPC 之 类 的 协议 完成 一 个 身份 认证 的 令 牌 ， 每 当 传送 更 新 的 某 些 
消息 字段 时 需要 修正 安全 信息 

ImpersonateSecurityContext 该 API 将 客户 端 安 全 内 容 作 为 假冒 令 牌 ， 附 加 到 调用 线程 

RevertSecurityContext ”该 API 停 止 假冒 安全 内 容 和 以 它 的 默认 初始 安全 令 牌 调用 线程 


表 12-5 消息 支持 API 








API 名 称 说 明 
MakeSignature 该 API 生成 一 个 安全 签名 ， 该 签名 基于 消息 和 安全 内 容 
VerifySignature KAP 验证 接收 到 的 签名 是 否 与 所 需 签名 匹配 
表 12-6 EEE AP 
API 名 称 说 明 
EnumerateSecurityPackages 该 API 列 出 所 有 可 用 的 安全 软件 包 及 其 功能 
QuerySecurityPackageInfo 该 API 能 查询 单个 安全 包 所 具有 的 能 力 


安全 包 的 各 种 能 力 实际 决定 了 应 用 程序 利用 包 能 获得 怎样 的 服务 。 能 力 可 分 成 三 个 组 : 
一 个 能 力 组 是 有 关 身 份 认 证 的 能 力 ， 包 括 纯 客户 身份 认证 、 连 锁 身份 认证 (微软 称 为 “多 
腿 ” 认 证 ) 、 和 Windows 200 假冒 。 第 二 个 能 力 组 是 传输 层 (第 1 章 中 讨论 ) 相关 能 力 ， 包 
括 报 文 方式 传送 、 面 向 连接 传送 以 及 数据 流连 接 语义 。 最 后 的 能 力 组 是 关于 消息 的 能 力 ， 包 
含 对 消息 集成 和 消息 各 有 化 的 支持 。 


12.9“HYDRA 一 -一 一 个 瘦 客 户 


Hydra 是 Windows 2000 瘦 客 户 的 代码 名 称 。 该 瘦 客 户 为 Windows 2000 服务 器 操作 系统 提 
供 基于 Windows 的 终端 支持 ， 为 整个 Windows 操作 系统 系列 提供 超级 瘦 客 户 。 其 目的 是 用 一 
种 低 成 本 的 终端 提供 有 效 的 基于 Windows 环境 的 管理 。 通 过 这 种 终端 ， 用 户 将 能 通过 Win- 
dows 2000 服务 器 实施 远程 访问 和 商务 活动 。 但 实际 的 终端 只 用 做 登录 以 及 与 服务 器 通信 ， 
并 没有 完整 的 功能 ， 如 存储 文件 到 该 终端 可 用 的 本 地 活动 磁盘 上 ， 而 是 严格 地 限制 访问 整个 
网 络 环境 。 对 于 瘦 客 户 只 有 终端 上 的 本 地 资源 才 人 允许 连接 和 实施 服务 器 功能 。 对 熟悉 UNIX 
世界 的 人 来 讲 ， 此 时 瘦 客 户 等 效 于 X 终端。 
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12.10 小 结 


总 之 ，Windows 2000 承诺 并 设计 成 能 比 NT 4.0 操作 系统 提供 更 优良 的 性 能 ,特别 是 有 关 
支持 分 布 式 计算 等 方面 。 几 平 基本 NT 技术 模式 的 每 个 主要 方面 ， 都 已 重新 设计 成 符合 当今 
的 应 用 需求 ， 即 要 求 每 个 操作 系统 都 能 提供 分 布 式 操 作 系 统 的 功能 。 虽 然 早期 系统 积累 的 经 
验 已 提供 了 足够 的 知识 库 ， 但 Windows 2000 中 的 设计 决策 是 否 是 完全 分 布 式 级 别 的 真正 先进 
的 计算 ， 还 将 由 时 间 来 证 明 。 时 间 也 将 告知 针对 应 用 需求 的 这 些 解 决 方案 是 否 行 之 有 效 。 可 
以 确信 ， 将 来 这 种 操作 系统 和 其 他 操作 系统 将 在 Windows 2000 操作 系统 广泛 推广 的 时 候 ， 会 
在 此 技术 基础 上 更 加 完善 。 无 论 在 哪 一 种 平台 上 开发 ， 很 难 相信 Windows 2000 在 将 来 的 计算 
中 不 会 产生 重大 的 影响 一 一 特别 是 分 布 式 计算 。 

曾经 有 一 种 保守 的 观点 ， 认 为 计算 永远 不 可 能 在 桌面 上 实现 ，Intemet 只 是 为 了 科学 家 
而 设 ， 分 布 式 计算 知识 只 有 专家 需要 ， 而 不 是 对 所 有 的 计算 机 学 家 。 相 信 这 种 观点 很 快 会 不 
攻 自 破 ， 因 为 计算 机 的 发 展 日 新 月 异 。 


12.11 参考 文献 


下 列 白皮书 参考 文献 能 提供 Windows 2000 更 详细 的 信息 和 基础 技术 的 有 关 协 议 。 微 软 的 
NT 服务 器 白皮书 地 址 为 : www.microsoft. com/ntserver/nts/techdetails [ Micr98]。 另 外 在 关于 Win- 
dows 2000 传统 研究 期 刊 中 有 一 些 论文 ， 如 [CAPK98，GaShMa98，Micr98 和 Sol98]。 

微软 NT 和 Windows 2000 操作 系统 白皮书 系列 在 Intemet 上 提供 了 一 些 最 好 的 技术 信息 ， 
涉及 到 微软 的 Windows 2000 操作 系统 。 关 于 某 些 使 用 协议 的 信息 也 能 在 Intemet 上 找到 。 
LDAP 的 RFC 放 在 下 列 URL 中 。 

4 http: //www. cis. ohio-state . edu/htbin/rfc/rfc2251 . html 

4 http: //www. cis . ohio-state . edu/htbin/rfe/rfc2252 . html 

@ http: //www. cis . ohio-state . edu/htbin/rfc/rfc2254. html 

4 http: //www. cis. ohio-state . edu/htbin/rfc/rfc2255 . html 

@ http: //www. cis. ohio-state . edu/htbin/rfe/rfc2307 . html 

LDAP 在 线 版 本 用 户 手 册 能 在 http: //www.umich. edu/ ~ dirsvcs/ldap/doc/man/ 找 到 。 另 外 ， 
包含 FAQ 站 点 的 与 LDAP 文档 有 多 个 链接 的 页 面 能 在 http: //www.umich. edu/ ~ dirsves/ldap/ 
doc/ 找 到 。 


习题 


12.1 贯穿 Windows 2000 整个 设计 特别 强调 的 是 提供 API， 提 供 实际 的 、 专 门 的 API 的 
优越 性 是 什么 ? 

12.2 讨论 将 子 系统 合并 到 Windows 2000 系统 结构 中 的 两 个 优点 。 

12.3 列 出 为 提高 Windows 2000 互 操作 性 和 硬件 独立 性 而 采用 的 三 个 主要 的 设计 要 素 。 
说 明 为 什么 每 个 要 素 能 提供 这 些 好 处 。 

12.4 修改 日 志 的 三 个 主要 优点 是 什么 ? 为 什么 ? 

12.5 讨论 对 等 复制 策略 对 大 规模 的 、 可 扩展 的 分 布 式 系统 的 优越 性 。 

12.6 如果 分 布 式 环境 允许 从 使 用 USN 中 获 益 ， 会 有 什么 不 同 ? 
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12.7 
12.8 


12.9 


12.10 
12.11 


12.12 
12.13 


12.14 


操作 系统 中 并 人 即 播 即 用 功能 的 三 个 优点 是 什么 ? 


利用 再 解析 点 的 什么 技术 能 非常 容易 完成 任务 ， 而 没有 这 种 技术 的 话 就 难以 实 
现 。 


为 什么 Windows 2000 中 的 索引 服务 器 的 服务 与 老 的 单 用 户 带 软 盘 驱动 器 的 DOS 相 
比较 更 有 效 ? 列举 并 描述 三 个 原因 。 
列 出 并 说 明 活动 目录 相对 于 义 .500 的 三 个 优点 ? 


集群 抽象 能 支持 多 少 种 类 型 的 透明 性 ? 为 什么 所 列 出 的 每 种 类 型 是 集群 所 固有 
的 ? 


WED ASHE RSE PKA EFS 技术 的 优点 。 


讨论 你 在 Windows 2000 中 最 喜欢 的 新 特性 ， 并 说 明 为 什么 它们 对 分 布 式 计 算是 
有 益 的 。 


为 什么 Windows 2000 运行 在 64 位 地 址 空间 的 时 候 需 要 改变 ? 
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附录 A 外科 手术 调度 程序 


外 科 手 术 调 度 程 序 作为 一 个 实例 用 来 补充 本 书 第 一 部 分 中 出 现 的 内 容 ， 尤 其 是 它 演示 了 
pthread (W32 章 ) 、INET 套 接 字 ( 见 第 3 章 ) 和 同步 互 斥 〈 见 第 4 章 ) 的 应 用 。 该 程序 在 
一 个 C/S 环境 中 实现 ， 客 户 端 是 一 个 请 求 外 科 配 置 的 外 科 医 生 系统 ， 服 务 器 端 是 用 于 维护 外 
科 配 置 调度 的 医院 系统 。 外 科 医 生发 出 一 个 请 求 并 将 其 送 到 医院 端 ， 医 院 端 在 有 效 的 时 间 内 
做 出 响应 来 安排 医务 调度 配置 。 医 生 端 再 选择 一 个 时 间 并 向 医院 端 发 回 确认 请 求 ， 而 医院 端 
确认 或 忽略 该 请 求 。 

A.1 一 A.5 节 是 程序 的 文档 部 分 。A.1 节 是 文档 的 概要 ，A.2 节 是 有 关 设 计 的 文档 资料 ， 
A.3 节 是 函数 描述 和 也 数 接口 ，A.4 节 则 包含 数据 字典 ，A.5 节 是 用 户 手 册 ， 包 括 安装 说 明 
和 执行 指令 。 从 A.6 到 A.8 节 包 含 客户 端 ， 服 务 器 端 源 代码 和 相应 的 通用 源 代码 。 

需要 指出 的 是 ， 该 代码 的 意图 是 清楚 地 说 明 分 布 式 程序 的 特征 ， 并 不 是 为 企业 开发 的 有 
效 程序 ， 困 些许 多 设计 要 点 ， 比 如 使 用 常数 表示 外 科 医 生 的 姓名 ， 并 不 推荐 或 鼓励 在 这 里 使 
用 。 之 所 以 这 样 设计 是 为 了 保证 代码 尽 可 能 简单 地 揭示 分 布 式 特征 。 


A.1 文档 概要 


每 部 分 源 代 码 的 安排 顺序 是 这 样 的 : 首先 是 主 函 数 文件 ， 然 后 是 该 程序 的 makefile X 
件 ， 再 接 下 去 是 头 文件 ， 最 后 是 源 代 码 文件 。 每 个 代码 文件 在 文件 头 的 注释 中 列 出 了 在 该 文 
件 中 出 现 的 函数 。 另 外 还 有 一 个 必须 但 仅 在 服务 器 和 客户 端 文档 中 引用 的 程序 是 初始 化 文件 
程序 。 它 的 操作 在 A.5 中 搞 述 ， 而 其 函数 描述 在 A.3 中 给 出 ， 源 代码 则 在 A.8 节 中 说 明 。 
它 仅 仅 是 一 个 用 于 建立 缩 构 文 件 的 简单 程序 ， 需 要 对 每 个 服务 器 运行 一 次 ,并 应 在 安装 时 
执行 。 

通过 对 数据 流 图 的 公 析 可 知 ， 图 中 的 圆 峰 表示 一 个 函数 ， 还 可 知道 读者 在 何 时 可 引用 
A.3 节 中 的 函数 描述 去 理解 每 个 水 数 操作 。 数 据 流 图 见 图 A-1 一 A-11， 其 中 客户 端 数据 流 图 
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图 A-1 外 科 手 术 调度 程序 流 概要 图 
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图 A-2 医生 数据 流 概要 图 
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A3 医生 系统 数据 流 图 


见 图 A-2 一 A-4， 服 务 器 端 流 图 见 图 A-5 一 A-11。 图 A-1 描述 了 整个 程序 数据 流 的 概要 。 岁 A-2 
是 医生 程序 数据 流 概 要 。 图 A-3 是 详细 的 医生 系统 数据 流 图 ， 而 图 A-4 则 是 医生 进行 选择 的 
数据 流 图 。 

图 A-5 是 医院 系统 数据 流 概要 图 ， 图 A-6 是 详细 的 医院 系统 数据 流 图 ， 图 A-7 是 处 理 初 
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始 请 求 的 数据 流 图 ， 图 A-8 表示 建立 /确认 可 用 性 的 数据 流 。 图 A-9 表示 观察 文件 状态 的 数 
据 流 ， 图 A-10 表示 评价 病房 选择 的 数据 流 图 ， 图 A-11 是 关闭 服务 器 的 数据 流 图 。 
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图 A-4 医生 进行 选择 的 数据 流 图 
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图 A-5 医院 数据 流 概要 图 
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图 A-6 医院 系统 数据 流 图 
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图 A-7 医院 系统 处 理 初 始 化 请 求 数据 流 图 
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图 A-8 医院 系统 建立 /确认 可 用 性 的 数据 流 图 
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图 A-9 ”医院 系统 观察 文件 状态 的 数据 流 图 
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图 A-10 医院 系统 评价 病房 选择 的 数据 流 图 
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图 A-11 关闭 服务 器 的 数据 流 图 


A.2 设计 文档 


外 科 手 术 调度 程序 确切 地 说 是 由 两 个 程序 组 成 的 ， 即 客户 端 程序 (外 科 医 生 ) 和 服务 器 
端 程序 (医院)。 这 两 个 程序 用 ANS C 程序 设计 语言 在 UNIX 环境 中 实现 。 套 接 字 用 INET% 
ERER, RAH POSIX 标准 pthread 库 实现 ， 而 同步 机 制 则 通过 pthread 互 斥 锁 来 实现 。 该 
程序 不 打算 对 年 份 的 跳跃 进行 修正 ， 也 不 认为 在 星期 五 调度 结束 之 后 时 间 将 跳 到 星期 一 。 我 
们 假设 外 科 医 生 端 每 周 有 七 天 可 进行 调度 ， 以 小 时 为 单位 的 时 间 段 从 0800 到 1600。 

在 设计 概要 中 并 没有 提 到 程序 中 使 用 的 所 有 函数 ， 那 些 主要 用 于 简化 和 改善 编程 风格 的 
BRA RE, AEN SWE HY BARRERA. Æ A.3 节 函 数 描述 中 列举 了 所 
有 使 用 过 的 函数 。 

在 服务 器 初始 运行 之 前 ， 必 须 先 运行 文件 初始 化 程序 。 由 于 该 程序 不 是 一 个 用 户 选项 ， 
因此 应 将 它 加 载 到 在 其 标题 之 下 的 文档 中 并 且 必 须 和 C/S 程序 分 开 运 行 。 

对 客户 和 服务 器 程序 分 别 使 用 它们 各 自 对 应 的 makefile 文件 进行 初始 化 。 该 makefile X 
件 包含 一 些 构造 命令 ， 用 以 说 明 一 些 相关 性 。 初 始 化 完成 后 ， 服 务 器 程序 必须 最 先 开始 运 
行 ， 因 为 程序 交互 就 是 通过 客户 发 出 服务 请 求 而 开始 的 。 

服务 器 程序 使 用 命令 hospitalrun 来 启动 。 当 输入 该 命令 后 ， 服 务 器 程序 从 main () F 
始 执行 ， 并 产生 一 个 线程 main_thread 以 接受 来 自 客 户 的 请 求 。 然 后 服务 器 的 main () 在 一 
个 while 循环 中 等 待 用 户 输入 。 用 户 可 以 使 用 有 效 的 选项 来 关闭 服务 器 。 在 线程 创建 过 程 中 
先 调用 函数 serversetup () 来 初始 化 一 个 套 接 字 端口 ， 然 后 函数 进入 一 个 while 循环 并 处 
于 接收 状态 等 待 用 户 请 求 。main_thread 也 将 处 于 接收 状态 直到 有 客户 发 出 请 求 或 用 户 打算 
关闭 服务 器 。 

客户 端 操作 使 用 命令 surgeonrun 来 启动 。 当 输入 该 命令 后 ， 客 户 端 main () 函数 进入 
do-while 循环 以 等 待 用 户 输入 。 用 户 可 以 选择 发 送 一 个 请 求 也 可 选择 退出 关闭 该 客户 程序 。 
如 果 客 户 选择 选项 R 发 送 请 求 ， 则 函数 clientsetup () 被 调用 。 该 函数 初始 化 一 个 客户 
端 套 接 字 端 口 并 发 送 消息 initial_request 到 服务 器 的 已 知 端口 。initial_request 是 一 个 结构 体 类 
型 initial _connect 的 变量 ,该 结构 中 的 数据 域 包 括 枚 举 类 型 "dr_id" 和 整 型 变量 new port. 4 
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个 特定 的 用 户 程序 中 定义 了 固定 的 dr_id， 所 以 用 户 不 需要 知道 这 个 信息 。 

当 initial_request 被 运行 于 函数 serversetup () 中 的 线程 main_thread 接收 时 ， 它 被 传 
送 到 服务 器 端 函 数 get new port ()。 该 机 数 返回 一 个 服务 器 端口 号 ， 这 个 端口 可 提供 给 
用 户 与 服务 器 进行 连接 直到 服务 完成 。 接 下 来 服务 器 函数 serversetup () 通过 INET BR 
字 返 回 initial_request 给 用 户 ， 其 中 包含 了 客户 可 用 来 与 服务 器 连接 以 完成 服务 的 端口 号 。 
然后 serversetup () 产生 一 个 线程 surgeon_thread 来 处 理 将 由 客户 发 来 的 请 求 。 在 sur- 
geon _ thread 线程 产生 后 ， 服 务 器 函数 run_request () 将 被 调用 ， 它 初始 化 一 个 套 接 字 并 
在 由 get_new_port O 返回 的 端口 号 上 等 待 。 接 下 去 该 处 理 线程 处 于 接收 状态 ， 等 待 用 户 
的 连接 。 这 时 ， 线 程 main_thread 已 经 处 理 完 初始 请 求 ， 通 过 while 循环 它 将 回 到 最 初 的 、 在 
已 知 端口 上 等 待 的 状态 、 

AP mA clientsetup () 接收 由 服务 器 发 回 的 新 端口 值 并 将 该 端口 值 返 回 到 主 函 
数 main () P. main O 再 调用 另 一 个 客户 端 函 数 blace_reaquest () 用 上 述 端 口 值 初 
始 化 一 个 套 接 字 并 且 与 用 户 连接 ， 因 此 可 以 得 到 客户 请 求 的 时 间 julian_date 和 所 需要 的 外 科 
医疗 类 型 。 然 后 place_request () 再 将 request 传送 到 服务 器 。request 是 一 个 结构 体 类 
型 day_request 的 变量 ， 它 的 数据 域 中 包含 枚 举 类 型 的 "dr_ id, WR julian_date， 枚 举 类 型 
的 surgery_type 以 及 范围 从 status0800 到 status1600 的 枚 举 类 型 room_status. 

运行 服务 器 函数 run_request () 的 线程 surgeon thread 接收 到 request， 然 后 将 指向 
request 的 指针 作为 参数 传递 到 服务 器 函数 review_rooms ()， 用 以 判断 哪些 病房 对 于 当天 
所 需 的 医疗 类 型 可 用 。 函 数 review_rooms () 先 对 将 被 打开 的 文件 类 型 设置 互 斥 锁 ， 再 打 
开 正 确 的 文件 并 建立 数组 init_room [366]。 数 组 类 型 是 名 为 room_struct 的 结构 体 类 型 ， 它 
的 数据 域 包含 整 型 的 julian_date, 74 EM status0800 到 status1600 的 枚 举 类 型 rooms_status, 
从 ptime0800 到 ptime1600 的 长 整 型 值 以 及 从 dr0800 到 dr1600 的 枚 举 类 型 dr _id。 消 息 re- 
quest 根据 有 关 病 房 的 相应 文件 的 当前 状态 进行 更 新 。 可 以 用 三 种 可 能 的 状态 来 更 新 request 
状态 ， 即 busy, open 或 pending。 如 果 请 求 的 病房 已 被 提交 ， 则 将 request 的 状态 域 改 为 
busy， 例 如 status0800 = busy。 如 果 在 过 去 的 十 分 钟 里 病房 状态 作为 open 已 被 传递 到 另 一 个 客 
户 ， 则 request 的 状态 域 用 pending 更 新 。 若 病房 可 用 ， 则 对 该 请 求 时 间 用 open 更 新 request 
的 状态 域 ， 同 时 数组 用 服务 器 当前 时 间 和 发 送 request 的 医生 的 "dr_id 进 行 更 新 。 者 数组 的 
状态 域 用 pending 更 新 ， 则 表明 虽然 病房 状态 为 open， 但 在 大 概 十 分 钟 之 前 该 状态 已 被 发 送 
到 另 一 用 户 ， 所 以 在 十 分 钟 过 去 之 前 ， 病 房 对 其 他 用 户 不 可 用 。 更 新 结束 后 ， 将 数组 内 容 写 
回 文 件 ， 解 除 互 斥 锁 。 程 序 将 已 更 新 的 request 返回 到 run_request ()。run request 
() 再 将 request 传 回 正 处 于 接收 状态 等 待 答复 的 客户 。 

客户 函数 place_request () 接收 到 上 述 的 消息 后 ， 调 用 函数 select_option () 并 
AY request 的 地 址 作为 参数 传递 给 它 。Select_option () 给 用 户 提供 了 一 个 接口 ， 允 许 
他 们 选择 一 个 由 服务 器 返回 并 被 标志 为 open 状态 的 时 间 。 各 个 选项 显示 在 屏幕 上 ， 用 户 需 
要 选择 其 中 一 个 有 效 的 时 间 。 如 用 户 输入 0000， 则 表示 没有 做 出 任何 有 效 选择 并 且 将 退出 
该 程序 。 选 择 完毕 后 ，select_room () 修改 request 的 相关 内 容 ， 控 制 转 回 到 客户 端 函数 
place_request ()。Request 再 次 由 该 蚂 数 发 送 到 正在 等 待 客户 响应 的 服务 器 线程 。 

线程 surgeon_thread 运行 run_request () 时 接收 request。 一 旦 接收 到 request, ARS 
器 函数 seiect_room () 被 调用 ，request 的 地 址 作为 参数 传递 给 它 。 同 样 ，select_room 
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O 也 对 将 要 打开 的 文件 上 锁 ， 正 确 打开 文件 并 建立 数组 init_room [366] (该 数据 结构 前 面 
已 说 明 过 )。 然 后 函数 遍历 request 的 数据 域 中 的 时 间 变 量 以 找到 由 用 户 Select 的 时 间 ， 这 
个 值 表示 用 户 需 要 请 求 使 用 的 时 间 段 。 函 数 再 比较 request 中 已 选 时 间 的 room_status 和 同 
一 时 间 数 组 元 素 中 的 room_status。 若 数组 数据 域 "dr id" 和 消息 request 数据 域 dr_id 的 值 相 
同 ， 则 用 confirm 更 新 request 的 room_status， 同 时 将 数组 相应 的 room_status 设置 为 busy。 
最 后 将 数组 写 回 文件 ， 关 闭 文件 并 解除 互 斥 锁 。 控 制 返回 到 run_request ()。run_re- 
quest () 将 已 被 修改 的 request 送 到 客户 端 ， 再 关闭 该 套 接 字 退出 surgeon. thread 线程 。 

客户 函数 place request () 通过 套 接 字 再 次 接收 到 request， 再 将 request 显示 出 来 
供用 户 核对 ， 最 后 还 进行 状态 的 评价 ， 让 用 户 明白 他 的 请 求 是 被 确认 还 是 被 拒绝 。 若 被 拒 
绝 ， 函 数 会 列举 出 所 有 可 能 的 原因 。 于 是 控制 返回 到 客户 主 函数 main O, 在 这 里 用 户 可 以 
发 送 另 一 个 请 求 或 选择 结束 客户 程序 。 

服务 器 线程 main thread 仍然 处 于 接收 状态 禾 听 是 否 有 来 自 于 其 他 用 户 的 请 求 。 对 该 线 
程 而 言 ， 用 户 只 有 终止 服务 器 这 个 惟一 选择 。 若 用 户 选 择 了 该 选项 ，main () 用 已 知 的 端 
口号 作为 参数 调用 stop_server (). stop_server () 创建 一 个 套 接 字 并 通过 INET 连接 
将 ”dr_id" 域 为 master 的 消息 initial _request 传送 到 函数 serversetup ()。serversetup () 
将 这 个 "dr_id" 值 传递 给 get_new_port (), 后 者 返回 值 99999。 这 个 值 会 中 断 serversetup 
O 中 的 while 循环 。 然后 serversetup () 将 所 有 文件 加 锁 (所 以 没有 一 个 文件 能 被 打 
开 )， 再 把 initial_request 返回 到 stop_server () 以 告知 所 有 文件 已 被 锁 住 。serverset- 
up () 最 后 关闭 其 套 接 字 并 退出 main_thread 线程 。 程 序 控制 返回 到 stop_server () 再 由 
stop_server () 返回 到 main ()。 由 于 所 有 文件 已 被 上 锁 ，main () 调用 pthread _ 
kill_other_threads_np () 终止 所 有 剩 下 的 正在 运行 的 线程 。 至此， 程序 将 进入 一 个 并 
语句 ， 而 用 户 可 选择 是 否 需要 程序 显示 一 天 中 各 种 类 型 病房 的 调度 情况 。 如 果 用 户 输入 及 
来 选择 显示 ， 则 程序 会 调用 函数 print_files (). 

若 用 户 输入 的 选择 不 是 R， 则 程序 终 闭 。 在 输入 的 情况 下 ，print_files () 会 进入 
一 个 do-while 循环 显示 用 户 选 择 的 任何 一 天 的 病房 调度 情况 。 显 示 后 若 用 户 输入 Z， 则 控制 
从 print_files () 返回 到 main ()。 服 务 器 程序 将 终止 并 且 只 能 用 命令 hospitalrun 来 重新 
启动 。 


A.3 函数 功能 描述 


本 节 中 将 要 描述 函数 功能 以 及 函数 接口 。 A.3.1 描述 主要 的 客户 端 函 数 ，A.3.2 描述 主 
要 的 服务 器 端 函数 。 客 户 端 和 服务 器 端 公用 的 函数 在 A.3.3 节 中 说 明 。 


A.3.1 客户 函数 的 功能 描述 


该 节 主 要 说 明 如 下 几 个 函数 的 功能 :， clientsetup (), evaluate_status (), main 
()、place request ()、select_it () 和 select_option (). HM A-12 是 这 些 函 数 的 状 
态 图 。 





int clientsetup(int addr_num) 


该 函数 用 于 初始 化 客户 。 它 用 一 个 已 知 的 服务 器 端口 值 addr_num 作为 参数 ， 用 这 个 参 
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main) 





clientsetup() 






place_request() 





evaluate_ 
status() 






6 





select_it() 





print_day_ 
request() 







5 





print_status() 





print_dr() 





print_type() 






8 






图 A-12 客户 /外 科 医 生 函 数 的 状态 图 


数 将 用 户 与 服务 器 套 接 字 绑 定 。 函 数 首 先 声 明 一 个 名 为 initial_connect 的 结构 体 类 型 变量 ini- 
tial_request， 然 后 将 该 月 户 的 枚 举 型 值 "dr_id" 赋 给 initial_request 的 相应 数据 域 。 对 每 个 客户 
而 言 ， 该 值 是 个 常数 。|nitial_request 的 new_port 域 被 初始 化 为 0， 它 可 以 被 其 他 函数 赋予 任 
何 整数 值 。 接 着 函数 创建 一 个 INET 数据 报 类 型 的 套 接 字 将 initial_request 用 数据 报 发 送 到 服 
Sat, Wiha clientsetup () 一 直 等 待 直到 收 到 从 服务 器 返回 的 initial_request， 它 带 回 一 
个 整 型 新 端口 值 new_port。 当 该 值 从 服务 器 返回 后 ，new_port 返回 到 调用 程序 。 


int evaluate_status (struct day request *request) 


该 函数 的 参数 是 一 个 指向 结构 体 day _request 的 指针 变量 request, BATE Hh request 所 
指 的 状态 值 并 告诉 用 户 所 发 生 的 事 。 函 数 体 中 有 一 个 并 语 句 用 于 测试 request > status0800 
到 request- > status160C 的 值 。 只 要 其 中 有 一 个 的 值 为 confirmn， 冰 数 就 会 向 用 户 显 示 消 息 
Your request has been confimed。 否 则 ， 就 会 最 示 出 对 可 能 原因 的 解释 信息 。 函 数 返 回 值 0。 


void main() 


客户 主 函数 main O 声明 了 一 个 字符 变量 user_select 和 一 个 整 型 变量 new port, MK 
首先 显示 欢迎 界面 ， 然 后 进入 一 个 do-while 循环 以 等 竺 用户 用 scanf () 输入 user_select。 
用 户 有 两 个 有 效 的 选项 ，R 表示 要 发 送 请 求 ，Q 表示 退出 程序 ， 其 他 任何 选择 都 会 导致 重新 
进入 do-while 循环 。 在 jo-while 循环 中 有 一 个 开关 语句 ， 它 使 用 user_select 作为 测试 表达 式 。 
如 果 选 择 了 R， 函 数 会 用 参数 KNOWN PORT 来 调用 clientsetup ()。KNOWN PORT 是 
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一 个 在 文件 commonh.h 中 定义 的 值 ， 它 是 服务 器 提供 给 所 有 初始 请 求 的 公用 端口 。client- 
setup () 于 是 建立 一 个 套 接 字 并 向 服务 器 发 送 数据 报 ， 最 后 由 初始 请 求 消息 返回 一 个 端口 
值 ， 返 回 值 存 放 在 变量 new_port 中 。clientsetup () KEK, place_request () 
被 调用 并 且 用 new_port 作为 参数 。 接 下 来 的 请 求 消 息 交 给 函数 place_request () 去 处 
理 。place_request () 完成 其 处 理 后 ， 重 新 进入 main () 的 do-while 循环 以 等 待 用 户 发 
出 另 一 个 请 求 或 退出 程序 。 若 用 户 选 择 了 R， 则 重复 上 述 序列 ; 若 选 择 了 QO, WAP ERR 
main () 终止 ， 以 后 只 能 用 命令 surgeonrun 来 重新 启动 它 。 

int place_request (int new port) 

本 函数 使 发 出 请 求 的 客户 和 一 个 专用 端口 上 的 服务 器 进行 通信 。 整 型 参数 new_port 表 
示 专 用 端口 的 值 。 函 数 首先 声明 一 个 结构 体 类 型 day_request 的 变量 request， 客 户 用 该 变量 
向 服务 器 发 送 请 求 ， 服 务 器 也 用 它 返回 一 些 状态 信息 。 然 后 再 声明 一 个 整 型 变量 my _sock 标 
记 用 于 连接 的 套 接 字 。 接 着 声明 整 型 的 julian_date 和 Selection, H+ julian_date 用 于 读 取 来 
自 于 用 户 的 请 求 日 期 ， 而 Selection 用 于 存储 对 菜单 的 选择 。 然 后 函数 创建 一 个 套 接 字 和 服 
务 器 绑 定 。 接 下 去 函数 进入 一 个 do-while 循环 以 接收 用 户 输入 的 请 求 日 期 julian_date。 这 个 
循环 保证 用 户 所 提交 的 日 期 介 于 1 到 365 之 间 。 输 入 合法 日 期 后 ， 程 序 再 进入 男 一 个 do 
while 循环 等 待 用 户 输 入 表明 其 所 需 进行 外 科 手 化 的 类 型 。 同 样 这 个 循环 保证 Selection 值 在 
所 定义 的 界限 中 。 然 后 Selection 作为 一 个 开关 语句 的 测试 表达 式 ， 根 据 用 户 的 选择 将 正确 
的 枚 举 型 值 surgery_type 赋予 request. surgery_name。 再 将 request. status0800 到 request. st- 
atus1600 赋值 为 open。 由 于 服务 器 的 操作 依赖 于 该 初始 化 请 求 信 息 ， 所 以 必须 要 对 上 述 变量 
赋值 open。 如 果 该 消息 没有 初始 化 为 open 状态 ， 则 服务 器 不 能 用 有 效 的 时 间 来 更 新 request. 
初始 化 完成 后 ，request 以 数据 报 的 形式 发 送 到 服务 器 。 接 下 去 ，place_request () 一 直 
等 待 以 接收 服务 器 的 响应 。 当 它 收 到 来 自 服务 器 的 数据 报时 ，request 中 的 时 间 域 已 更 新 为 
满足 客户 所 需要 的 手术 类 型 的 日 期 与 时 间 。 然 后 blace_recuest () 调用 函数 select _op- 
tion () 并 将 request 的 地 址 作为 参数 传递 给 它 。select_option () 与 用 户 交互 并 用 用 户 
的 选择 修改 request. select _option () 返回 后 ，place request () 用 数据 报 将 re- 
Quest 发 往 服务 器 ， 并 再 次 处 于 等 待 接收 状态 。 当 它 再 次 接收 到 服务 器 响应 后 ， 用 request 





作为 参数 调用 print _day request ()， 该 函数 显示 出 的 内 容 供 用 户 查 看 。 显 示 完 成 后 ， 


print_day_request () 返回 调用 也 数 。 接 着 evaluate status () 被 调用 ， 它 用 一 个 指 
向 request 的 指针 作为 参数 。evaluate_status () 显示 信息 以 告诉 用 户 他 的 请 求 是 否 被 服 
务 器 确认 ， 若 被 拒绝 则 显示 相关 的 原因 。 完 成 evaluate_ status () 的 任务 后 关闭 套 接 字 ， 
place request () 返回 0。 


int select_it (enum room status *this room status,int time Select) 


该 函数 检查 this_room_status HRA HERP MERE DAR. BMA — + 过 请 句 来 
考察 this_room_status 的 值 。 如 果 this_room_status 的 值 为 open， 则 将 this_room _status 更 新 
为 select 状态 ， 这 个 值 表 示 该 选择 有 效 。 于 是 函数 返回 0。 如果 this_room_status 不 是 处 于 
open 状态 ， 函 数 立 即 显示 一 条 信息 表明 这 个 选择 的 时 间 无 效 ， 然 后 显示 出 该 无 效 时 间 time_ 
Select 并 返回 1。 


int Select option (struct day request *request) 


342 
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使 用 该 函数 用 户 可 以 从 所 有 有 效 的 时 间 中 选择 一 个 他 所 需要 的 时 间 来 安排 外 科 手 术 。 郴 
数 的 参数 是 从 服务 器 (医院 系统 ) 返回 的 当前 消息 request 的 地 址 。 函 数 中 声明 了 一 个 整 型 
变量 time_Select 用 于 存储 用 户 输 入 的 选择 ， 还 声明 了 另 一 个 整 型 变量 valid_Selection 把 它 作 
为 一 个 标志 来 确定 用 户 输入 的 有 效 选 择 。 如 果 valid_Selection 的 值 为 1 (为 假 ) 则 函数 进入 
一 个 while 循环 ， 直 到 valid_Selection 的 值 变 成 0 (为 真 )。 如 果 用 户 选 择 了 一 个 处 于 open tk 
态 的 时 间 ， 说 明 该 时 间 不 是 busy 也 不 是 pending， 那 么 循环 结束 。 首 先 调用 函数 print_day_ 
request ()， 它 的 参数 是 一 个 指向 消息 request 的 指针 。 它 向 用 户 显 示 一 个 可 用 时 间 的 列 
Ko print_day_request () 函数 返回 后 ， 用 户 立 即 输入 他 们 将 要 选择 的 时 间 time_Select. 
然后 用 time Select 的 值 作为 一 个 开关 语句 的 测试 表达 式 。 如 果 它 的 值 与 request- > sta- 
tus0800-request- > status1600 中 某 一 个 状态 为 open 的 相等 ， 就 将 request > statusXXXX 更 新 
AY Select 状态 ， 并 将 valid_Selection 的 值 改 为 0 从 而 退出 while 循环 。 如 果 time_Select 的 值 不 
等 于 request- > status0800 - request- > status1600 中 任何 … 个 状态 为 open 的 ， 函 数 就 会 显示 
出 一 条 信息 表示 所 选 的 时 间 无 效 ， 然 后 重新 进 人 while 循环 。 如 果 用 户 输入 一 个 值 0， 则 表 
示 不 做 出 任何 选择 并 退出 while 循环 。 当 valid_Selection 被 设置 成 0 时 循环 终止 ， 函 数 返 回 值 
0s 


A.3.2 服务 器 函数 功能 描述 
本 节 描 述 几 个 主要 的 服务 器 函数 :get_new_port ()、main ()、print files (), 


review_rooms ()、 run_request (), select_room (), select stat ()、server- 
setup (), stop_server (), test_pend () Mlupdate_stat ()。 图 A-13 是 这 些 函 数 的 


状态 图 。 
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int get new port (struct initial connect update port) 


该 函数 用 于 维护 有 效 ”dr_id" 列 表 并 且 返 回 服务 器 上 为 它们 保留 的 端口 号 。 它 用 一 个 结构 
体 类 型 initial_connect 变量 作为 参数 ， 参 数 中 包含 了 枚 举 类 型 的 "dr_id”"。 函 数 用 一 个 开关 语句 
测试 该 值 ， 用 drid 作 测 试 夷 达 式 。 函 数 最 后 返回 分 配给 那个 ”dr_id" 的 整 型 端口 号 。 


void main() 


服务 器 主 函数 main (首先 声明 一 个 名 为 main thread 的 pthread 线程 ， 然 后 再 声明 一 
个 指向 整 型 值 addr_num 的 指针 并 为 它 分 配 内 存 ，addr_num 用 来 存放 服务 器 的 一 个 公共 的 端 
口 地 址 KNOW _PORT。 此 外 函数 还 有 一 个 字符 变量 menu _option. main _ thread 用 函数 
pthread_create () 创建 ， 在 线程 创建 过 程 中 会 调用 serversetup ()。 生 成 的 主线 程 
main_thread 还 可 以 产生 其 他 线程 来 处 理 外 科 医 生 的 请 求 。 这 一 切 做 好 后 ，main () 进入 一 
个 do-while 循环 等 待 用 户 输 入 menu_option。 此 时 服务 器 将 阻塞 在 函数 scant O 处 以 等 待 
用 户 输入 惟一 有 效 的 选择 来 关闭 服务 器 。 在 这 里 我 们 用 字符 & 作为 惟一 有 效 的 输入 ， 因 为 
久 不 常用 ， 更 容易 避免 由 于 误 操 作 而 导致 的 服务 器 关闭 。do-while 循环 一 直 等 待 用 户 的 输入 
直到 用 户 输入 字符 & 时 才 退 出 。 在 循环 进行 的 时 间 里 ， 线 程 main_thread 正在 处 理发 到 服务 
侈 的 所 有 初始 请 求 并 产生 一 - 些 子 线程 处 理 和 客户 的 通信 。 当 用 户 输入 '&' 时 ，main O 调用 
stop_server () 并 向 它 传递 一 个 指向 KNOW_PORT 的 指针 变量 addr_num。 函 数 stop_ 
server () 将 使 服务 器 对 所 有 的 临界 区 (文件 ) 上 锁 ， 然 后 退出 线程 main_thread 并 安全 地 
关闭 服务 器 。 一 旦 stop_server () 结束 ，main () 会 调用 pthread_kill_other_ 
threads_np() 将 终止 所 有 的 线程 。 于 是 man thread 及 其 子 线程 都 将 终止 。 接 下 去 ，ma- 
in() 通过 使 用 一 个 主语 句 允 许 用 户 显 示 文 件 。 如 果 用 户 选择 R 要 求 显 示 ， 那么 调用 
print_files ()， 它 可 以 显示 任何 一 天 和 任何 文件 状态 的 信息 。 如 果 用 户 没 有 选择 orint 
_files ()， 或 者 选择 的 显示 已 结束 ， 则 程序 终止 ， 以 后 只 能 用 命令 hospitalrun 重新 启动 服 
务 器 。 


int print files() 


该 函数 用 于 在 服务 器 端 显示 文件 信息 。 它 先 声 明 结构 体 类 型 room_struct 的 数组 init_ 
room [366] 用 来 存放 文件 信息 。 函 数 主体 是 一 个 do-while 循环 ， 它 一 直 循 环 直到 用 户 要 求 
退出 。 在 这 个 循环 体 之 中 还 有 一 个 do-while 子 循环 体 ， 它 等 竺 用户 输入 -一 个 有 效 的 选择 。 函 
数 会 显示 出 用 户 对 需要 打 天 和 显示 的 文件 的 选择 。 如 果 用 户 输 入 有 效 的 选择 ， 函 数 正确 地 打 
开 文件 并 且 用 文件 中 的 数据 初始 化 数组 init_room [366]。 接 着 系统 混 示 用 户 输入 需要 显示 
的 日 期 ， 这 时 会 进入 另 一 个 do-while 子 循环 以 确保 用 户 输入 的 值 介 于 1 和 365 之 间 。 当 用 户 
进行 有 效 的 选择 后 ， 程 序 调 用 函数 print type (), print_status (), print dr () 和 
printf () 将 当天 的 信息 输出 给 用 户 ， 然 后 文件 关闭 。 用 户 重新 回 到 主 循环 的 开头 再 次 做 
出 选择 。 如 果 用 户 选择 了 2， 主 循 环 结束 ， 函 数 终止 并 且 返 回 0。 


int review_rooma(st.ruct day request *request) 


该 函数 用 来 检查 医院 有 哪些 病房 可 提供 给 客户 (EE) 安排 手术 。 它 的 参数 是 一 个 指向 
当前 请 求 变量 的 指针 ， 该 请 求 变量 的 所 有 时 间 域 被 初始 化 为 open 状态 。 函 数 声明 一 个 字符 
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数组 变量 roomtype 和 结 艾 体 数 组 init_room [366]， 前 者 用 来 表示 需要 用 哪 一 个 文件 来 建立 
数组 ， 后 者 用 来 存放 被 选 文件 中 的 信息 。 接 下 来 的 开关 语句 用 request- > surgery_name 作为 
测试 表达 式 ， 它 确定 外 科 医 生 所 需 的 病房 类 型 。 根 据 房间 的 类 型 ， 函 数 strcpy () 将 ro- 
omtype 赋值 为 将 要 使 用 文件 的 文件 名 ， 再 调用 pthread_mutex_lock O 为 必要 的 文件 操 
作 上 锁 。 然 后 打开 文件 共用 文件 中 的 数据 初始 化 数组 init room [366]。 接 下 去 程序 调用 函数 
test pend () 若干 次 ， 这 个 函数 的 参数 为 一 对 变量 的 地 址 ， 这 些 值 分 别 为 init_room [i] 
,status0800 一 init _ room [i] .status1600 和 init_ room [i] .ptime0800 一 init _ room [i] 
.ptime1600, K #t test_pend () 用 于 测试 pending 状态 是 否 结束 ， 并 用 相关 的 信息 更 新 变 
Æ init_room。 再 接着 review_rooms () 调用 update stat O 若干 次 ， 像 上 面 的 test_ 
pend () 一 样 ， 地 址 分 别 为 init_room [i] .statusO800—init_room [i] .status1600, init_ 
room [i] .ptime0800 一 nit room [i] .ptimet600，request- > status0800 一 request- > sta- 
tus1600 以 及 request-> “dr_id”. update_stat () 检查 每 一 个 room_status 是 否 为 open 并 
相应 地 更 新 request 和 init_room 的 值 。 完 成 操作 后 处 于 读 状态 的 文件 关闭 ， 然 后 再 打开 它 进 
行 写 操作 。 将 init_room 的 值 写 回 文件 后 ， 程 序 用 request > surgery_name 作为 一 个 开关 语句 
的 测试 表达 式 来 决定 应 该 解除 哪 一 个 互 斥 锁 。 在 写 文 件 关闭 后 ， 打 开 互 斥 锁 ， 函 数 返回 0。 


void run_request(int *new_addr) 


该 函数 在 线程 surgeon_thread 创建 后 被 调用 ， 它 在 一 个 已 分 配给 客户 的 端口 上 处 理 来 自 
于 该 客户 的 请 求 ， 该 端口 是 为 客户 所 专用 以 完成 和 服务 器 的 通信 。 

函数 首先 用 new_adar 的 值 创 建 并 财 定 一 个 套 接 字 ， 接 着 该 套 接 字 处 于 接收 状态 等 待 从 
客户 发 往 该 端口 的 请 求 消息 。 它 所 接收 到 的 数据 报 中 包含 一 个 结构 体 类 型 day_request 的 变 
量 request。 中 数 用 该 变量 的 地 址 值 调用 review_rooms (), review_rooms () 用 有 效 的 
时 间 值 更 新 消息 request， 从 而 可 以 让 用 户 根据 该 消息 的 信息 来 做 出 选择 。 当 review_ro- 
oms () 完成 时 ，request 通过 数据 报 传 回 用 户 端 。run_request () 再 次 进入 接收 状态 等 
待 客户 的 响应 。 当 函数 再 次 接收 到 消息 request 时 ， 用 户 已 经 用 其 选择 的 时 间 对 request 进 
行 了 更 新 。 程 序 用 request 的 地 址 值 调用 函数 select_room () 对 适当 的 文件 进行 更 新 并 进 
行 必要 的 检查 。select_room () 完成 后 ，rin_request () 将 确认 信息 连同 已 更 新 的 re- 
quest 一 起 发 回 客 户 端 。 最 后 关闭 套 接 字 退 出 线程 surgeon_thread。 





int select _room(struct day request *request) 


该 函数 更 新 相应 的 病房 文件 并 确认 用 户 选 择 病房 的 日 期 和 时 间 。 它 的 参数 是 一 个 指向 结 
构 体 类 型 day _request 的 指针 ， 该 结构 体 变量 中 有 一 个 时 间 的 值 已 初始 化 为 Select RA. BR 
先 声 明 一 个 字符 数组 romtype 表示 需要 用 哪 一 个 文件 来 创建 数组 ， 然 后 进入 一 个 用 re 
quest- > surgery_name 作为 测试 表达 式 的 开关 语 和 名 来 确定 用 户 (E) 选择 的 病房 类 型 。 
函数 stropy O 根据 房间 的 类 型 将 roomtype 赋值 为 即将 使 用 的 文件 的 文件 名 ，Pthread_ 
mutex_lock () 则 对 开关 语句 之 后 的 文件 操作 加 锁 。 接 着 打开 正确 的 文件 并 用 文件 中 相关 
的 值 初始 化 数组 init_roorn。 然 后 函数 用 多 个 if-else 语句 来 比较 request- > status0800 一 re- 
quest- > status1600 中 哪 一- 个 状态 为 Select。 若 某 个 时 间 的 状态 值 为 Select， 则 函数 select _ 
stat () 被 调用 ， 并 用 request. statusXXXX (XXXX = 0800—1600 中 的 一 个 值 ) init_room 
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[i] .statusXXXX，request- > dr_name 和 init_room [i] .drXXXX 的 地 址 作为 参数 。Select _ 
stat () 根据 传递 给 它 的 参数 值 来 确定 或 拒绝 状态 为 Select 的 请 求 ， 并 对 请 求 进行 相应 的 修 
改 。select_stat () 返回 后 ， 用 于 读 的 文件 关闭 ,用 于 写 的 文件 打开 并 将 init_room 的 信 
息 写 回 文件 。 接 下 来 程序 用 request- > surgery_name 作为 一 个 开关 语句 的 测试 表达 式 来 决定 
应 该 解除 哪 一 个 互 斥 锁 。 在 写 文件 关闭 后 ， 打 开 互 斥 锁 ， 函 数 返回 值 0。 

int select_stat (enum room_status *request_room_status, enum 


room status *file room status, enum “dr _ id” *request_dr, enum 
“dr id” *file dr); 


该 函数 根据 传递 来 的 参数 决定 接受 还 是 拒绝 来 自 于 客户 的 请 求 。 它 的 参数 是 状态 为 se- 
lect 的 指针 变量 request_room_status。 函 数 首 先 用 一 个 让 语句 测试 request_dr 的 值 。 如 果 re- 
quest_dr = file_dr 则 file_room_status 更 新 为 busy，file_dr FÆ, request_room_status 更 新 为 
confirm, 如果 request dr! :=file_ dr， 则 表明 病房 已 被 其 他 用 户 选择 ， 所 以 request_room_sta- 
tus 更 新 为 busy。 注 意 : 如 果 客 户 的 ID 与 fle_room_status 中 的 相等 ， 则 不 论 状态 如 何 ， 将 
该 房间 分 配给 客户 是 安全 能。 在 该 客户 或 dr 记 改 变 前 其 他 用 户 不 能 申请 它 ， 而 且 一 旦 一 个 
病房 在 第 一 次 被 选择 ， 它 将 不 会 处 于 open 状态 ， Mab’ dr_id’ RM pending RA. BRR BIL 
回 0。 


void serversetup(int *addr_num) 


在 pthread_creat () 中 调用 该 函数 ， 它 由 服务 器 程序 中 的 线程 main_thread 运行 。 调 
用 它 时 需要 向 它 传 递 一 个 拱 向 已 知 端口 号 的 指针 addr_num AF SRS BERS AE. BR 
首先 声明 一 个 线程 surgeon thread， 用 它 产生 子 线程 在 特定 的 端口 上 处 理 客户 请 求 消息 。 然 
后 再 声明 整 型 指针 变量 * new_addr。 接 着 函数 创建 和 绑 定 一 个 套 接 字 ， 并 且 初 始 化 一 些 在 
子 线程 中 使 用 的 互 斥 变量 。 然 后 函数 用 一 个 while 循环 使 程序 不 停 地 运行 直到 用 户 要 求 服务 
器 关闭 〈 关 闭 操作 将 在 本 函数 功能 描述 的 后 面 介绍 )。 一 旦 进入 while 循环 ， 线 程 就 处 于 接收 
状态 等 待 用 户 发 送 一 个 包含 initial_connect 结构 体 类 型 变量 initial_request 的 数据 报 。 收 到 数 
据 报 后 ，serversetup () 调用 get_new_port () 并 向 它 传递 参数 initial _request。 get _ 
new_port () 返回 一 个 分 配给 特定 用 户 的 端口 号 ， 再 用 这 个 返回 值 更 新 initial_request.new_ 
port。 接 着 向 客户 发 送 一 个 包含 该 新 端口 号 的 数据 报 ， 然 后 创建 surgeon_thread 并 调用 run- 
request ()。runrequest () 建立 一 个 套 接 字 去 处 理 剩 下 的 客户 请 求 任务 。 而 server- 
setup () 则 重新 回 到 循环 的 开头 再 次 等 待 其 他 用 户 的 初始 请 求 initial_request。 先 前 提 到 的 
surgeon_ thread 将 继续 运行 以 处 理 用 户 的 其 他 特殊 请 求 ， 直 到 stop _server () 向 
serverinit () 发 送 一 个 initial_request.“dr_id 值 为 master 的 数据 报 。serverinit () 收 
到 该 数据 报 后 调用 get _new_port ()。 由 于 ”dr_id" 的 值 为 master fr LI PRM get _new_port 
() 返回 值 99999， 这 个 值 全 循环 终止 。 退 出 循环 后 ， 为 每 个 互 斥 锁 调用 函数 othread_mu- 
tex_lock () 以 保证 数据 的 完整 性 。 然 后 serverinit () 将 一 个 数据 报 发 回 给 stop_ 
server (), 该 数据 报 中 initial_request.new_port 的 值 设 置 为 99999。 这 个 消息 通知 stop _ 
server () 所 有 的 互 斥 锁 已 经 锁 上 。 最 后 关闭 套 接 字 并 调用 pthread_exit () 退出 线程 
main_thread。 


int stop_server (int addr_num) 
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该 函数 用 来 关闭 服务 性 。 它 的 参数 是 一 个 用 于 与 服务 器 套 接 字 绑 定 的 已 知 端口 号 。 函 数 
首先 声明 一 个 类 型 为 initial _connect 的 结构 体 变量 initial request。 当 该 结构 体 变 量 访问 完 所 
有 的 临界 区 后 它 的 "dr_ id 数据 域 设 置 成 master， 用 该 值 通知 服务 器 进行 关闭 操作 。 而 initial_ 
request.new_port 的 值 初始 化 为 0， 它 可 被 赋 以 任何 整 型 值 。 然 后 函数 创建 一 个 INET 数据 报 
类 型 的 套 接 字 并 将 initial_request 传递 到 服务 器 ， 接 着 函数 处 于 接收 状态 ， 等 待 任何 表明 已 
关闭 服务 器 的 返回 值 。 最 后 关闭 套 接 字 并 将 99999 返回 给 调用 程序 。 


int test_pend(enum room status *this room status long int *this time) 


该 函数 查看 房间 状态 ， 如 果 房 间 的 pending 状态 已 结束 就 对 其 进行 更 新 。 函 数 首先 声明 
类 型 为 timeval 的 结构 体 变量 current_time 作为 请 求 消息 的 时 间 惟 。 当 天 的 当前 时 间 可 由 函数 
gettimeofday () 得 到 。 接着 用 一 个 许 语句 测试 this_room_status 以 确定 该 值 是 否 为 枚 举 
型 的 状态 值 pending。 如 果 所 申请 的 房间 状态 为 penqing， 则 函数 进入 另 一 个 站 语句 。 第 二 个 
站 语句 比较 this_time 和 时 间 稚 的 当前 时 间 。 如 果 请 求 的 时 间 已 超过 十 分 钟 就 将 this_room _ 
status 更 新 为 open， 因 为 处 于 pending 状态 的 时 间 段 已 经 用 完 。 如 果 this_room_status 不 是 
pending， 或 者 处 于 pending 状态 的 时 间 不 超过 十 分 钟 ， 则 this_room_status 仍然 保留 其 原来 的 
值 。 最 后 函数 返回 0。 

int update stat (erum room status *request_room status, enum 


room status *file room status, long int *this_time, enum “dr id” 
*request dr, enum “dr id” *file dr); 


该 函数 根据 数据 文件 的 信息 更 新 所 申请 房间 的 状态 和 dr_id。 它 首先 声明 类 型 为 timeval 
的 结构 体 变 量 current_ tme 作为 请 求 消 息 的 时 间 惟 。 当 天 的 当前 时 间 可 由 函数 get- 
timeofday () 得 到 。 接 着 函数 有 一 个 else 语句 测试 fle_room_status 从 08: 00 到 16: 00 
是 否 为 open 状态 。 如 果 文 件 中 没有 一 个 时 间 段 可 用 (处 于 “open” 状 态 )， 则 将 request_ 
room_status 赋值 为 数组 中 的 状态 值 ，file_room_status 不 变 。 如 果 file_room_status 是 open, 
就 将 它 改 为 pending，current_time 的 值 写 到 this_time 中 并 将 request_room_status 赋值 为 
open。 于 是 客户 被 告知 该 时 间 段 可 用 。 客 户 (医生 ) 现在 有 十 分 钟 的 时 间 对 该 消息 做 出 反应 
或 者 可 能 丢失 它 。file_dr 用 选择 了 该 时 间 段 的 客户 "dr_ ji 进行 更 新 。 认 else 退出 ， 函 数 返 
回 0。 


A.3.3 公用 函数 的 功能 描述 

本 节 描 述 几 个 客户 端 和 服务 器 端的 公用 函数 ; print _day_request (), print dr 
(), print_status (), pirnt_type () 和 run request ()。 

int print day request(struct day request request) 

该 昂 数 用 于 显示 来 自 客 户 或 服务 器 的 请 求 信 息 。 它 的 参数 是 类 型 为 day_request 的 结构 
体 变量 request, MME THR: 医生 的 姓名 、 请 求 的 日 期 、 手 术 的 类 型 以 及 时 间 从 
08: 00 到 16: 00 的 状态 。 显 示 医 生 的 姓名 可 通过 调用 函数 print_dr () 来 实现 ， 只 需 向 


它 传 递 参数 request.dr_name。 手 术 的 类 型 信息 可 用 参数 request. surgery_name 调用 函数 
print_type () 来 实现 。 手 术 的 日 期 则 可 直接 显示 出 来 ， 因 为 日 期 是 一 个 整 型 变量 。 至 于 
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病房 不 同时 间 的 状态 信息 可 通过 调用 print status O 来 实现 ， 向 它 传递 的 参数 为 re- 


quest. status0800 - request.status1600。 函 数 最 语 返 回 0。 

int print _ dr (enum “dr id” this dr) 

该 函数 显示 医生 的 姓名 。 它 的 参数 是 一 个 枚 举 类 型 dr_id 的 变量 。 函 数 的 开关 语句 以 
this_dr 作为 测试 表达 式 ， 框 据 表 达 式 的 值 显 示 出 相关 的 医生 姓名 。 最 后 函数 返回 0。 

int print_status(enum room status this room status) 

该 函数 显示 病房 的 状态 信息 ， 它 的 参数 是 一 个 枚 举 类 型 room status HRE. RIF 
关 语句 以 this_room_status 作为 测试 表达 式 ， 根 据 表达 式 的 值 显示 出 相关 的 状态 信息 。 最 后 
函数 返回 0。 


int print_type(enum surgery type this type) 


该 函数 显示 外 科 手 术 类 型 的 名 称 。 它 使 用 一 个 枚 举 类 型 surgery_type 的 变量 作为 参数 。 
函数 的 开关 语句 以 this_type 作为 测试 表达 式 ， 根 据 表达 式 的 值 显示 出 相关 的 类 型 信息 。 最 
Ja R gG 0。 


A.3.4 文件 初始 化 





void main() 


文件 初始 化 主 函 数 main O 用 来 初始 化 服务 器 中 在 外 科 手 术 调 度 程 序 中 使 用 的 文件 。 
对 服务 器 而 言 ， 该 函数 只 需 调 用 一 次 ， 因 为 所 有 对 文件 的 更 新 操作 都 通过 服务 器 函数 来 实 
现 。 它 也 可 用 于 初始 化 一 些 已 损坏 且 不 可 挽救 的 文件 。 警 告 ， 该 函数 将 覆盖 所 有 以 前 已 被 调 
度 的 信息 。 

函数 先 声明 结构 体 类 型 room_struct 的 数组 init_room [366]， 类 型 为 timeval 的 结构 体 变 
量 current_time， 字 符 变量 user_select， 字 符 数 组 this_file [] 和 整 型 变量 |。 数 字 366 用 来 代 
表 一 年 的 365 天 。 如 : Julian day 1 = init_room [1], Julian day 2= init_room [2] 等 等 。 然 后 
进入 一 个 do-while 循环 ( 当 用 户 没有 选择 退出 时 )， 接 着 进入 该 循环 中 的 男 一 个 do-while 循 
环 ， 第 二 个 循环 用 于 确保 用 户 作 出 选择 的 有 效 性 。 函 数 会 显示 提示 信息 要 求 用 户 选择 需要 初 
始 化 的 文件 。 用 户 可 以 从 4 一 D 中 选择 (有效 的 文件 选项 ) 或 选择 Z 退出 程序 。 程 序 等 待 用 
户 用 函数 scant O 输入 user_select。 如 果 用 户 选 择 了 A 一 D 中 的 一 个 ，strcpy O 将 适当 
的 文件 名 复制 到 数组 this_fle 中 。 再 调用 函数 Gett imeofday () 取得 当天 的 当前 时 间 并 将 
它 存 人 current_time 中 。 然 后 程序 进入 一 个 for 循环 ,循环 变量 从 1 到 366， 用 下 面 的 默认 值 
初始 化 数组 init_room: 

$ Init_room [i] .statusXXXX = “open” , 





$ Init_room [i .ptimeXXXX = current_time. tv_sec, 

4 Init room [i, .drXXXX = “none”, 

+ (XXXX = 0800-1600) 

函数 会 根据 用 户 的 选择 将 数组 内 容 写 回 相应 的 文件 ， 然 后 文件 关闭 ， 用 户 回 到 外 层 循环 进 
行进 一 步 的 选择 。 这 个 过 程 将 一 直 持续 下 去 直到 用 户 选择 了 Z， 这 时 函数 退出 而 程序 终止 。 
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A.4 数据 字典 
Bi: 


alphanumeric = {A...|z|a...|z|0...|9} 
char = {A...|zZļa... |z} 

numeric = {0...19} 

FILE = 


*defined in man pages* 


pthread_mutex_t = 


*defined in pthread library man pages* 


pthread_t = 
*defined in pthread library man pages* 


sockaddr_in = 


350 *defined in socket library man pages* 





字典 ， 


addr num = [numeric] 

cardio room mutex = [pthread mutex t] 

client = {sockaddr_in] 

client len = [numeric] 

current time = [{timeval] 

day_request = [dr_name + surgery name + julian date + 
status0800 + status0900 + status1000 + 
status1100 + statusl200 + status1300 + 
status1400 + statusi500 + status1600] 


dr0800 = [“dr_id”] 
Gr0900 = ["“dr_id”] 
Grl000 = [“dr_id”} 
Gr1100 = [“dr_id”] 
dr1200 = [“dr_ida”] 
Gr1300 = [“dr_id”] 
dr1400 = ["dr id”) 
dr1500 = {“dr_id”] 
dri600 = [“dr_id”] 
“dr_id” = 


[“johnson” |”“smith”|”"williams”|"jones”|”master” |"none”] 


dr name = {“dr_id"] 


DRNAME = [“dr_id”] 
error num = [numeric] 
file room_status = [room status] 


i = [numeric] 
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initial _comnect = |dr name + new port] 

initial request = [initial connect] 

init_room[} = [room_struct] 

julian date = [numeric] 

KNOWN PORT = [numeric] 

known_sock = [numeric] 

main thread = {pthread_t] 

menu_option = [alphanumeric] 

my sock = [numeric] 

neuro room mutex = [pthread mutex t. 

new_add = [numeric] 

new addr = [numeric] 

new port = [numeric] 

ortho room mutex = [pthread mutex t] 

plastic room mutex = [pthread_mutex_t] 

ptimeC800 = [numeric] 

ptimeC900 = [numeric] 

ptime1000 = [numeric] 

ptime1100 = [numeric] 

ptimei200 = [numeric] 

ptimel300 = [numeric] 

ptimel400 = [numeric] 

ptimel500 = [numeric] 

ptimei600 = [numeric] 

request = [day request] 

room file = [FILE] 

room status = [“busy” |" open” | “pending” | “Select” |“confirm”] 

room_struct = [julian_date 
+ status0800 + ptime0800 dr0800 
+ Status0900 + ptime0900 Qr0900 
+ Status1000 + ptimel000 dr1000 
+ status1100 + ptimel100 Gr1100 
+ status1200 + ptimel200 dr1200 
+ status1300 + ptimel300 dr1300 
+ statusi400 + ptimel400 dr1400 
+ status1500 + ptimel500 dr1500 
+ statusi600 + Ptimel600 dr1600] 

roomtype = [alphanumeric] 

Selection = [alphanumeric] 

server = [sockaddr in] 

SERVER HOST = [numeric + “.” + numeric + ”.” + numeric 
+ "." + numeric ] 

server len = [numeric] 


status0900 = [room_status] 
statusl000 = [room_status] 
statusl100 = [room_status] 
status1200 = [ 

status1300 = [room status] 
statusl400 = [room_status} 
status1500 = [room _status] 


room_status] 
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status1600 = [room_status] 

stop request = [initial_connect] 

surgeon thread = [pthread_t] 

Surgery_name = [surgery type] 

surgery type = [“neuro”|"cardio”|"clastic”|”ortho”} 

surg type = {surgery type] 

this dr = [“dr_id”] 

this file[{) = [alphanumeric] 

this room status = [room status] 

this time = [numeric] 

this type = [surgery type] 

thread_sock = [numeric] 

time Select = [numeric] 

update port = [initial connect] 

user select = [alphanumeric] 

valid Selection = [(0|1)] }; 
A.5 用 户 文档 


本 节 包 含 一 些 运行 该 程序 必要 的 文档 。 其 中 A.5.1 节 是 安装 说 明 ，A.5.2 节 说 明了 运行 
程序 的 信息 。 


A.5.1 安装 说 明 


服务 器 的 安装 需要 在 编译 前 设置 两 个 定义 ; KNOW_PORT 和 SERVER_HOST。 前 者 是 服 
务 器 接收 初始 连接 请 求 的 公用 端口 号 ， 后 者 是 服务 器 的 下 地 址 ， 这 两 个 定义 都 在 文件 com- 
monh.h 中 。 服 务 器 也 要 求 运行 文件 初始 化 程序 ， 该 程序 的 源 代码 在 文件 write_ca.c 中 。 要 运 
行 该 程序 ， 安装 者 需要 键 人 命令 ce write_ca.c 进行 编译 。 编 译 结束 后 ， 键 人 aou 来 运行 。 
文件 初始 化 程序 会 自动 从 该 点 加 载运 行 ， 它 会 为 4 种 不 同类 型 的 手术 病房 各 建立 一 个 文件 并 
用 默认 值 初始 化 这 些 文件 。 

在 安装 过 程 中 ， 服 务 器 程序 也 需要 把 那些 正确 的 枚 举 型 值 在 文件 commonh.h 中 反映 出 
来 ,并且 用 所 有 有 效 的 "cr_id" 值 更 新 各 个 开关 语句 。 相 关 的 开关 语句 可 以 在 函数 get_new_ 
port () 和 print_dr () 中 找到 。 

客户 端的 安装 也 需要 在 编译 前 设置 两 个 定义 : KNOW_PORT 和 DRNAME。 前 者 的 意义 和 
服务 句 端 的 同名 变量 相同 ， 后 者 是 分 配给 该 用 户 的 "dr_id”"。 对 客户 端 而 言 ， 不 需 其 他 任何 进 
一 步 的 操作 。 


A.5.2 如 何 运行 程序 


注意 ; 在 尝试 运行 该 程序 之 前 要 确保 安装 完成 1! 详 见 前 一 节 的 安装 信息 。 

运行 该 程序 仅仅 要 求 所 有 有 效 文件 在 同一 个 UNIX 文件 目录 下 ， 且 当前 版 本 的 C 编译 器 
E UNIX 系统 中 可 用 。 客 户 端 程序 和 服务 器 端 程序 都 运行 于 Redhat Linux4.2 和 C 编译 器 
GNU2.7。 服 务 器 所 需要 的 文件 是 : commonc.c, hospital.c, inethosp.c, serverinit.c, write_ca.c 
(程序 init_files 用 于 建立 并 初始 化 数据 文件 ) commonh.h, hospital.h 和 makefile (服务 器 专 
用 )。 客 户 端 所 需 的 文件 是 ，commone.c、surgeon.c、inetsurg.c、clientinit.c、commonh.h、sur- 
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geon.h 和 makefile (客户 端 程序 专用 )。 

如 果 文 件 是 有 效 的 ， 则 必须 要 保证 包含 这 些 文件 的 目录 是 工作 目录 。 用 户 必须 键入 
“makefile” 进行 编译 ， 链 接 和 比 定 。 完 成 后 ， 如 果 用 户 处 于 服务 器 端 ， 则 键入 “hospitalrun” 
启动 服务 器 ; 若 处 于 客户 端 则 键入 surgeonrun 启动 客户 端 程序 。 由 此 看 来 ， 两 个 程序 都 是 独 
立 引 导 和 菜单 驱动 的 。 

注意 : 4 room strut 显示 在 服务 器 端 时 ， 这 些 输出 表示 在 以 前 客户 发 出 请 求 的 某 一 天 中 
处 于 pending 状态 的 任何 时 间 段 ， 并 且 该 时 间 段 没有 被 选择 。 当 客户 面前 显示 一 条 请 求 信息 
时 ， 它 会 对 在 每 一 个 时 间 上 处 于 open 状态 的 请 求 显示 Open。 


A6 客户 端 源 代码 


A.6.1 inetsurg.c 


/x 
inetsurg.c 文件 是 该 调度 程序 中 客户 端的 主 嗓 数 main () 文件 。 
文件 中 包括 的 水 数 是 : main ()。 
该 程序 是 John A.Fritz 在 Dr.D.L.Galli 的 指导 下 完成 。 
*/ 
#include "“commonh.h' 
X 包含 一 些 服务 器 和 客户 公用 的 头 文 件 和 定义 */ 


#include "surgeon.h" 
/% 包含 为 客户 专用 的 头 文 件 和 定义 */ 


[ HRHEKK HK HK KKK KKK KKK MAIN HHH HK HK HEHE EK KEKE / 


void main() 


{ 
enum “dr id” this doc; 
/* 声明 该 变量 用 于 显示 欢迎 界面 * / 
char user_select [1]; 
| * 存储 用 户 的 选择 */ 
int new_port; 
/客户 与 服务 器 连接 的 端口 号 x / 
chis doc = DRNAME; 
/< 给 this_doc 赋值 为 已 定义 这 的 名 字 */ 
printf("\n\n\n Welcome to the Surgeon Scheduling 


Program Dr. "); 
print_dr(this_ doc); 


/x* 最 示 医 生 的 姓名 ， 使 界面 友好 */ 
do 


/*x 一 - 直 允 许 用 户 发 送 请 求 直到 用 户 选 择 Q 退 出 */ 
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printf("Enter 'R' to make a request, 'Q' to quit ‘n"), 
scanf ("%s", user Select) 

user _select[0] = toupper(user_select[0]); 

switch (user_select [0]) 


{ 


case 'R': 
new_port = clientsetup{KNOWN_PORT) ; 
place_request (new _port) ; 
break; 
case 'Q': 
printf("Shutting down system. \n"); 
printf(“Please Enter 'surgeonrun' 
to begin again \n"); 
break; 
default: 
printf("You have chosen an invalid 
option.\n"); 
break; 


| /x 25 $ switch »* / 
| /x 结束 while * / 


while(user select [0j != 'Q'); 





355 | /x* 结束 main */ 
A.6.2 Client Makefile 
# 调度 程序 中 客户 端 程序 的 makefile 文件 。 


surgeonrun: inetsurg.o clientinit.o surgeon.o commonc.o 
cc -o surgeorrun inetsurg.o clientinit.o surgeon.o commonc.o 
inetsurg.o:commonh.h surgeon.h 
clientinit.o: comnonh.h surgeon.h 
surgeon.o: commonh.h surgeon.h 
commonc.o: commonh.h hospital.h 


A.6.3 Surgeon.h 


/x surgeon.h 文件 用 于 维护 客户 端 所 专用 的 包含 文件 和 定义 ， 外 科 手 术 调 度 程序 。 
*/ 
#define DRNAME smith; 
/# 建立 从 客户 端 发 送 请 求 的 医生 的 "dr_id"， 每 一 个 客户 端 程序 应 该 为 
相应 的 医生 设置 该 数据 域 x*/ 
int clientsetup (int addr_num) ; 
[> ACEP R BHR, SRHSRANT SRA BERFREHS 
知 端口 值 。 函 数 处 于 等 竺 状态 接收 新 端口 号 。 当 它 接 收 到 从 服务 器 返回 
的 这 个 值 时 ， 新 端口 号 返回 到 该 调用 程序 * / 
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int place request (int new_ port),; 


/< 初始 化 专用 于 某 个 请 求 的 新 端口 。 传 递 的 参数 是 一 个 新 端口 值 ， 这 
个 端口 专门 为 该 请 求 服务 直到 服务 完成 x / 


int select option (struct day_request *request) ; 


/* AA PHRASE GRA PRA, PEASE 
向 结构 体 变量 day_request 744+, BKAAGHA P tRNA RA | 356) 
息 x/ 


int evaluate_status (struct day_request *request) ; 


/x 检测 结构 体 day request 变量 的 状态 以 告诉 用 户 所 发 生 的 事 。 传 递 的 
参数 是 从 服务 器 (医院 ) RASH SABAH IL, BRR AK 
中 的 信息 向 用 户 显示 request 的 状态 消息 */ 

int select_it(enum room_status *this room status, int 

time_Select) ; 


/x 函数 检查 * this room status 的 值 以 确定 是 否 为 open 状态 。 传 递 的 参 
数 是 被 举 类 型 变量 room _status。 如 果 * this_room_status = open 则 返回 值 
为 0， 否则 向 用 户 报告 并 返回 1*/ 


A.6.4 Clientinit.c 


/ * clientinit.c 文件 描述 了 外 科 手 术 调 度 程序 中 的 clientsetup () 函数 
包含 的 函数 是 : clientsetup ()o 
x / 
#include "commonh.h" 
I= 包含 所 有 公共 头 文件 的 本 地 文件 x*/ 
#include "surgeorn.h” 
/x 包含 所 有 为 客户 端 〈 医 生 ) 专用 的 头 文件 的 本 地 文件 x / 
struct initial_connect initial_request; 
/x 请 求 在 特定 端口 建立 连接 的 结构 体 传 送 到 服务 器 */ 
| KHKHH HHH KKK KKH HK KKH HEHEHE clientsetup HXKRK HHH HHH KKHKK KK HERKEN | 


int clientsetup(int addr_num) 


/x* 初始 化 客户 端的 函数 。 传 递 的 参数 是 用 于 与 服务 器 套 接 字 绑 定 的 已 知 
端口 值 。 浮 数 处 于 等 待 状 态 接收 新 端口 号 。 当 它 接 收 到 从 服务 器 返回 
的 这 个 值 时 ， 新 端口 号 返回 到 该 调用 程序 */ 
{ 
int known_sock, /# 标志 这 个 特定 的 套 接 字 */ 
/x 标志 服务 器 信息 的 长 度 x/ 


struct sockaddr_in server, 
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/为 服务 器 产生 端口 的 intemet RA * / 
client; 

(x 为 客户 产生 端口 的 internet 版 本 * / 
struct msghdr msq; 

/x* 声明 将 在 sendmsg 中 使 用 的 结构 体 */ 
struct iovec jov[1}j; 

| * 存储 消 息 sendmsg 中 的 数据 和 数据 长 度 信息 的 结构 x/ 
initial_request.dr_name = DRNAME; 

/x%* 将 以 前 为 该 用 户 定义 的 值 存放 在 初始 化 的 request 中 x/ 
initial_request.new_port = 0; 

/x 发 送 请 求 消息 到 服务 器 前 将 request 的 new_port 初始 化 为 * / 
server.sin family = AF_INET; 

/ * 建立 intemet 类 型 的 连接 */ 
server.sin_poxt = htons (addr num); 

/x 分配 一 个 传递 给 该 函数 的 端口 号 x) 
server.sin_addr.s addr = inet addr (SERVER_HOST) ; 

/#< 哥 找 inet 地 址 ， 主 机 的 确切 地 址 在 文件 commonh.h 中 给 出 x/ 
if ((known_sock = socket (AF_INET, SOCK_DGRAM, 0)) <0) 

/* 为 该 连接 建立 一 个 句柄 。 连 接 范 围 是 用 于 连接 不 同 机 器 的 AF_INET 网 

Ho SOCK_DGRAM 是 进行 通信 的 数据 报 形式 。 该 例子 是 非 连接 的 。 第 
三 个 参数 是 使 用 协议 的 ，0 表示 默认 值 */ 

{ 


perror("Client Socket Error "); 


exit(1); 
| /x 结束 让 x/ 
client.sin_ family = AF_INET; 
/* 建立 internet 类 型 的 连接 */ 


client.sin_addr.s_ addr = htonl'INADDR_ANY) ; 

/< 地 址 被 设置 成 INADDR_ANY， 人 允许 进行 默认 分 配 * / 
client.sin_port = htons(0); 

/* 默认 值 0 允许 连接 到 任何 端口 */ 
if (bind(known_sock, (struct sockaddr *) &client, 

sizeof (client)) <0) 


/* RBRS OES RABEFRE, AE FER known sock, &client 
有 是 客户 信息 、 网 络 名 和 网 络 协议 。 第 三 个 参数 是 指针 的 字 节 数 */ 
{ 


perror("Client Bind Error"); 
exit{1); 
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| /x 结束 ifx / 

server_len = sizeof (server); 
msg.msg name = ichar *) &server; 
msg.msg namelen = server_len; 
msg.msg_iov = iov; 
msg.msg_iovien = 1; 

msg.msg_ control = NULL; 
msg.msg_controllen = 9; 


/* X sendmsg 对 msg_name 结构 和 iov 赋值 。msg_name 是 可 选择 的 ， 它 表示 
接收 者 的 地 址 (连接 协议 上 不 需要 该 选项 )。msg _namelen = 名 字 的 长 
度 。msg_iov= 输 入 输出 缓冲 数组 。msg_iovlen = msg_iov 中 元 素 的 数量 。 
msg_control = 辅助 数据 ， 设 置 为 NULL。msg_controllen = 接收 消息 的 结果 
dä * / 


iov[0].iov_base = &initial_request; 


/x 即将 发 送 的 initial request 的 地 址 */ 
iov[0].iov_ler = sizeof (initial request) ; 
if (sendmsg(known_sock,&msg,0) < 0) 


/x 发 送 消息 到 服务 器 ， 需 要 将 新 的 端口 值 与 msghdr iovec 中 的 值 重 新 连接 
起 来 。 它 也 将 消息 发 送 给 客户 。 第 一 个 参数 是 套 接 宇文 件 描述 符 ， 第 
二 个 参数 是 指向 msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 x / 
| 


perror ("Sendmsg") ; 
exit (1); 


| /x 结束 if*/ 


if (recvmsg (known sock, gmsg ,0) < 0) 


/* 接收 来 自 于 服务 器 的 消息 。 该 消息 带 回 一 个 端口 值 用 于 与 服务 器 重新 
连接 完成 通信 。 第 一 个 参数 是 套 接 字 文 件 描 述 符 ， 第 二 个 参数 是 指向 
msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 * / 

{ 


perror ("Client Recvmsg Error"); 
close (known_sock) ; 
exit(1); 


| fx Rife / 


close (known_sock) ; 


/* 关闭 套 接 字 ， 不 再 为 该 客户 事务 服务 x / 
return(initial request.new_port) ; 

/* RES AT ARE P RY He O x / 
| /* 2 RX HH clientsetup * / 
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A.6.5 Surgeon.c 


/ * surgeon.c 维护 一 些 外 科 手 术 调 度 程序 中 客户 端 专用 的 函数 。 
AA ELIE: 
place_request (), 
Select_option (), 
evaluate_status (), 
select_it () . 
x*/ 


#include "commonh.h" 


/x 包 钨 所 有 公共 头 文件 的 本 地 文件 */ 


#include "surgeon.h" 


/* 包含 所 有 为 客户 端 〈 医 生 ) 专用 的 头 文件 的 本 地 文件 x / 


struct day request request; 
/x 用 于 从 客户 端 向 服务 器 传送 消息 和 从 服务 器 返回 消息 的 结构 体 #*/ 
| RXXKRHXHA RAKE REHKKIEN place_request HH HHHHEK KKK AK HIN KAH HHH, / 
int place_request (int new_port) 
/# 该 函数 用 来 在 特定 的 端口 上 完成 request 的 通信 。 传 递 的 参数 是 一 个 新 
疾 口 值 ， 分 配 它 作 为 请 求 信息 的 专用 端口 直到 通信 结束 */ 


int my_sock, /* 表明 这 个 特定 的 套 接 字 x / 
server len, 


/* 表明 服务 器 信息 的 长 度 x*/ 


julian date; 
/* 同 于 读 取 来 自 于 用 户 的 请 求 日 期 x/ 
char Selection11] : 
/* 读 取 用 户 对 所 提供 选项 的 选择 */ 
struct sockaddr_in server, 


/* 为 服务 器 产生 端口 的 internet HRA * / 


client; 


(* ABP > 43% 2744 intemet HA * / 


struct msghdr msg; 


/* 用 于 说 明 sendmsg 结构 x / 


struct iovec iov[1]; 


/* 为 sendmsg 存储 数据 和 数据 长 度 信息 的 结构 */ 


request .qdqr_nare = DRNAME; 


/x 给 该 请 求 分 配 一 个 在 文件 surgeon.h 中 定义 的 # define 值 ， 这 个 值 对 每 
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个 客户 而 言 必须 设置 而 且 不 可 更 改 */ 


server.sin family = AF_INET; 


/* 建立 internet 类 型 的 连接 xX*/ 


server.sin_port = htons(new_port) ; 


/* PBL Se BIE BBA HH OT x / 
server.sin_addr.s_ addr = inet_addr(SERVER_HOST) ; 


/* 寻找 inet 地 址 ， 主 机 的 确切 地 址 在 文件 commonh.h 中 由 
# define SERVER_HOST 给 出 x*/ 
if ((my_sock = socket (AF_INET, SOCK DGRAM, 0)) < 0) 1 361 


/% 为 该 连接 建立 一 个 套 接 字 。 和 连接 范围 是 用 于 连接 不 同 机 器 的 AF_INET 
网 络 。SOCK_DGRAM 是 进行 通信 的 数据 报 形式 。 该 例子 是 连接 的 。 第 
三 个 参数 是 使 用 的 协议 ，0 表示 默认 值 */ 
{ 
perror("Client Socket"); 
exit(1); 
) * BER if */ 
client.sin_family = AF_INET; 
族 见 前 面 对 服 务 器 的 描述 */ 
client.sin addr.s addr = ntonl (INADDR ANY); 
雍 地 址 设置 为 INADDR_ANY, 允许 进行 默认 分 配 提 
client.sin_port = htons(0); 
J RIME 0 允许 连 接 到 任何 端口 */ 
if (bind(my_sock, (struct sockaddr *) &client, 
sizeof (client)) <0) 
/* 将 套 接 字 的 值 与 这 个 套 接 字 绑 定 。 该 套 接 字 的 值 是 my_sock, &client 是 
客户 信息 ， 网 络 名 和 网 络 协议 。 第 三 个 参数 是 指针 的 字 节 数 */ 


{ 


perror ("Client Bind"); 
exit (1); 
) Pe Rif */ 
server_len = sizeof (server); 
* 来 自 于 Er 的 请 求 信息 ， 其 中 包含 用 户 要 求 服务 的 日 期 和 手术 的 类 型 。 
这 些 信 息 存 放 在 即将 向 服务 器 发 送 的 结构 体 中 */ 


/#* 支 持 请 求 julian_date 直到 输入 一 个 有 效 的 日 期 */ 


printf ("What Julian Date are you requesting surgery for ? \n"j; 
scanf("%d", &julian_date); 
} /* 结束 do-while */ 
en data] || (julian date >365)); 
request.julian_date = julian_date; 
1* 将 用 户 所 请 求 的 值 存放 在 即将 传递 到 客户 端的 结构 体 变量 request 中 ， 然 ng 
后 向 用 户 显示 一 些 选 项 要 求 他 们 输入 房间 的 类 型 */ 
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do 
{ 
printf ("\n\n\n What type of surgery would you like to schedule? 
\n"); 
printf ("Please make Selection out of the following choices: \n"); 
printf(* A = neuro surgery \n"); 
printf(" B = cardio-vascular surgery \n"); 
printf(" C = plastic surgery \n"); 
printf(" D orthopedic surgery \n"); 
scanf ("%s", Selection); 
Selection[0] = toupper (Selection[0]); 
switch (Selection[0]) 


六 根据 用 户 的 选择 ， 对 即将 发 送 到 服务 器 的 request 的 数据 域 surgery WE */ 


case 'A': 
request .surgery_name = neurc; 
break; 
case 'B': 
request .surgery name = cardio; 
break; 
case 'C!: 
request .surgery name = plastic; 
break; 
case 'D': 
request .surgery_name = orthc; 
break; 
default: 
printf ("Invalid Selection \n"); 
} /* 结束 switch */ 
/# 将 request 中 的 每 一 个 房间 状态 设置 为 open。 服 务 根据 这 些 值 做 出 相应 动 
作 。 如 果 某 个 房间 不 可 用 。 服 务 器 就 改变 该 状态 。 因 此 它 不 会 修改 处 于 
open 状态 的 房间 状态 ， 如 果 房 间 可 用 ， 它 的 状态 值 仍然 为 open */ 
} /* 结束 do-while */ 
/* 循 环 一 直 进行 直到 用 户 作 了 有 效 的 选择 */ 


while ({Selection[0] != 'A') 
&& (Selection[0) != 'B') 
&& (Selection[O] != ‘C') 
&& (Selection[0] != 'D')); 


request.status0800 = open; 
request.status0900 = open; 
request .statusl000 = open; 
request .statusl100 = open; 
request.status1200 = open; 
request .status1300 = open; 
request.statusl400 = open; 
request.status1500 = open; 
request.statusl600 = open; 
server_len = sizeof (server) ; 
msg.msg_ name = (char *) &server; 
msg.msq namelen = server len; 
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msg.MSgQ_iov = iov; 
msg.msg_iovlen = 1; 
msg.msg_control = NULL; 
msg.msg controllen = 0; 
/* 4 sendmsg 对 msg 结构 和 iov HUA. msg name 是 可 选择 的 ， 它 表示 接收 者 
的 地 址 ( 渤 接 协议 上 不 需要 该 选项 ). msg namelen= 名 字 的 长 度 。msg_iov 
= 输入 输出 缓冲 数组 。msg iovlen=msg iov 中 元 素 的 数量 。msg_control= $f 
助 数据 ， 没 置 为 NULL。msg_controllen= 接收 消息 的 结果 值 */ 
iov[0j ,iov base = &request; 
/* 即将 发 送 的 initial_request 的 地 址 */ 
iov [0] ,iov len = sizeof (request); 
if (sendmsg(my_sock,&msg,0) < 0) 
/* 发 送 request 消 息 到 服务 器 希望 得 到 满足 请 求 日 期 和 请 求 手术 类 型 的 时 间 列 
表 。 第 一 个 参数 是 套 接 文件 的 描述 符 ， 第 二 个 参数 是 指向 msghdr 的 指针 
第 三 个 参数 是 一 个 标志 +/ 
{ 


perror ("Sendmsg") ; 
close (my_sock) ; 
exit (1); 
} /* ee & it */ 
if (reevmsg(my_sock, &msg ,0) < 0) ' 
/* 接 收 来 自 于 服务 器 的 消息 。 该 消息 带 回 有 效 时 间 的 列表 以 完成 请 求 通信 。 第 
一 个 参数 是 套 接 字 文 件 描述 符 ， 第 二 个 参数 是 指向 msghdr 的 指针 ， 第 三 个 
参数 是 一 个 标志 
{ 
perror ("Client Recvmsg Error"); 
close (my_sock) ; 
exit (1); 
} /* ikk if */ 
Select_option(&request) ; 
/* 将 request 传递 到 函数 Select_option 以 检查 服务 器 指明 的 哪些 时 间 是 有 效 的 
并 允许 用 户 从 这 些 有 效 时 间 中 选择 一 个 
if (sendmsg(my_sock,&msg,0) < 0) 
/* 将 请 求 发 送 到 服务 器 ， 请 求 中 包含 用 户 作出 的 选择 。 详 见 前 面 的 sendmsg */ 
{ 
perror ("Sendmsg") ; 
close (my_sock) ; 
exit(1); 
} /* 结 束 证 和 
if (recvmsg(my_sock, &msg ,0) < 0) 
/*# 接 收服 务 器 的 反应 ， 结 构 体 变量 request 告诉 用 户 请 求 已 确认 或 者 要 求 用 户 
重 发 request， 无 论 是 哪 一 种 情况 程序 都 将 结束 */ 


{ 


perror ("Client Recvmsg Error"); 
close (my_sock) ; 

exit (1); 

} eR if */ 


print_day_request (request); 
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ARAP ET request 的 信息 ， 告 诉 他 们 从 服务 器 ( 医院 ) 返回 时 的 状态 信息 */ 


evaluate status (&request) ; 


/+ 核查 上 述 状 态 ， 并 告诉 用 户 其 请 求 已 确认 或 要 求 他 们 重新 提交 请 求 */ 


close (my_sock); 
/x 关闭 套 接 字 ， 不 再 为 该 客户 事务 服务 x / 
return (0); 
| /x ÆR BIH place_request * / 
| 兴 关 闪闪 关 关 闪闪 兴 兴 关 兴 共 关 兴 关 Select_option KKKKHK HHH KK KIER HK HH / 
int Select_option (struct day_request * request) 
/x* 程序 允许 用 户 从 可 用 的 时 间 中 选择 他 们 将 要 安排 手术 的 时 间 段 。 传 递 的 参 
数 是 由 服务 器 返回 的 当前 结构 的 地 址 。 最 后 函数 按 用 户 的 选择 更 新 该 结构 
*/ 
| 
int time_Select, 
/# 用 于 读 取 用 户 从 所 提供 的 选项 中 选择 的 时 间 项 x/ 
valid Selection; 
/* 用 于 表示 用 户 何 时 作出 了 有 效 选择 * / 
time Select =0; 
/#< 初始 化 为 一 个 非 有 效 值 的 任何 值 */ 
prinzf ("Following is the status of times 
of your request \n"); 
valid_Selection=1; 
/x* 设置 一 个 无 效 状 态 来 检测 有 效 状态 的 设置 x / 
while (valid Selection! =0) 
/循环 一 直 进 行 到 选择 一 个 处 于 open 状态 的 时 间 。 这 表明 该 时 间 还 没 被 提交 
或 者 不 处 于 pending 状态 * / 
| 
print_day_request (* request); 
/x* 显示 传递 给 该 函数 的 结构 体 中 的 可 用 时 间 x*/ 
printf ("Please type in the numeric time 
you would like to Select in the \ n”); 
printf ("following format: XX00, where XX 
is the hour. Example: 0800 \ n”); 
printf ("If you would like to return with 
no option”,”selected , please enter 0000 \ n”); 
scanf ("%d", «time Select); 
/x 获得 用 户 选 择 ， 然 后 进入 开关 语句 去 处 理 该 选择 x*/ 


switch (time Select) 
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case 800: 
valid_Selection = 
select_it (&request- > statusd80d, 
time Select); 
/x select 让 将 鉴别 该 选择 是 有 效 的 《open 状态 ) 还 是 已 经 被 别人 所 选 ( 不 是 
open 状态 1。 如 果 选 择 是 有 效 的 ，select it 返回 0，while 循环 将 终止 ; 如 果 
选择 无 效 ， 则 返回 值 为 1， 用 户 必 须 再 作出 选择 */ 
break; 
case 900: 
valid Selection = 
select it (&request->status0900, 
time Select) ; 
break; 
case 1000: 
valid Selection = 
select _it (&request->statusl000, 
time Select); 
break; 
case 1100: 
valid Selection = 
select_it (&request->statusii00, 
time Select); 
break; 
case 1200: 
valid Selection = 
select_it (&request->statusl2060, 
time Select); 
break; 
case 1300: 
valid Selection = 
select it (&request ->status1300, 
time_Select) ; 
break; 
case 1400: 367 
valid Selection = 
select _it (&request->statusl400, 
time_Select); 
break; 
case 1500: 
valid Selection = 
selact_it (&request ->status1500, 
time Select); 
break; 
case 1600: 
valid Selection = 
select _it(&request ->statusl1600, 
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time Select); 


break; 
case 0: 
valid Selection = 0; 
break; 
/xX 返回 没 做 出 任何 选择 的 结构 体 / 
default: 


printf ("Time Selection %d 
is not valid or is not in open status. \n", 
time Select) ; 

printf ("Please choose again.\n"); 


| /* 结束 switch * / 
| /x ER while x / 
| /x 结束 函数 Selection_option * / 


[ HRKKEKKKKEKKKERERHRHKK evaluate Status 关 兴 兴 关 尖 兴 关 兴 兴 兴 闪闪 关 兴 关 尖 关头 尖 兴 尖 兴 关 / 
int evaluate status (struct day _request * request) 
(* 函数 检测 结构 体 变 量 day_request 的 状态 值 并 告诉 用 户 所 发 生 的 事 。 传 
递 的 参数 是 由 服务 器 返回 的 当前 结构 的 地 址 。 函 数 根据 结构 体 中 的 值 
向 用 户 显 示 有 关 请 求 状态 的 信息 * / 


/x* 若 许 在 一 个 状态 被 确认 ， 则 告知 用 户 x/ 





if ((request->status0800 == confirm) 
|| (request->status0900 == confirm 
|| (request ->statusl000 == confirm) 
|| (request->status1l100 == confirm) 
|| (request->status1200 == confirm) 
|] (request->status1300 == confirm) 
|| (request->status1400 == confirm) 
|| (request->status1500 == confirm) 
|] (request->status1600 == confirm) ) 


{ 
printf ("Your request has been confirmed.\n"); 


| /x 结束 x/ 
else 


/x* 和 否则 向 用 户 解释 为 什么 没 被 确认 x/ 
{ 


printf ("Your request has been denied. \n 
Possible reasons: \n 
1) Your ten minute response window 
had expired. \n 
2) You chose to not make a selection. \n 


3) System error.\n"); 
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| /* 结束 elsex/ 
| /* #5 ® Bk evaluate status * / 


| 关 兴 兴 关 兴 兴 闪闪 关 尖 关 关 关 兴 关 关 尖 关 兴 关 SGleCt 让 HHH HHH HK HHH KH HHH ER / 
int select_it (enum room status * thigs room status, int time Select) 
/* 该 函数 检测 x this_room_status 的 值 是 否 为 open 状态 。 需 要 传递 的 参数 是 
枚 举 类 型 room_status 的 变量 。 如 果 x this_room_status 44H open, 4k 
返回 0; 否则 向 用 户 显 示 相 关 信 息 并 返回 T#/ 


if (xthis room status = =open) 
/x 如果 状态 是 open， 表 明 它 是 一 个 有 效 选 择 ， 所 以 用 该 选择 更 新 状态 */ 
{ 
*this room_status = Select; 
return(0); 
| /x* BR ifs / 
else 
/* 否则 它 是 一 个 无 效 选择 ， 负 用户 显 示 提 示 信 息 并 返回 1 x/ 
{ 


printf ("Time Selection %d 
is not valid cr is not 
in open status. \n", time Select) ; 
printf ("Please choose again. \n"); 
return (1); 


| /x 结束 elsex/ 
| /x 结束 函数 select itx / 


A.7 服务 器 源 代码 


A.7.1 Inethosp.c 


/* inethosp.c 是 外 科 皇 术 调 度 程序 中 服务 器 端 主 池 数 文件 。 
包含 的 函数 : main ()。 
该 程序 是 John A.Fritz 在 Dr.D.L.Galli 的 指导 下 完成 。 
x*/ 
# include “commonh.h’” 
/# 服 务 器 和 客户 公用 的 .h 文 件 和 定义 %/ 
# include "hospital.h” 
/x 仅 为 服务 器 使 用 的 .h 文 件 #/ 
pthread_t main_thread; 
/#< 主 线程 ， 它 产生 子 线程 来 处 理 调度 请 求 */ 


| KKHKHHK HHH KKH HHH MAN 关 关 关 关 闪闪 闪闪 党 关头 关 尖 尖 关 兴 关 兴 闪闪 关头 关头 / 





369 


370 
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void main () 


| 
int error num; /* 用 于 返回 错误 信息 x/ 
int *addr_num; /* ARIE ZS OF Wed x / 
char menu_option [1]; 
| * 存放 用 户 对 菜单 的 选择 * / 
if((addr_num= (int*) malloc (sizeof (int)) = =NULL) 
/* 为 主 端口 值 分 配 空 间 x/ 
| 
perror ("malloc"); 
exit (1); 
| /x 结束 if*/ 
x * addr num= KNOWN_PORT; 
/* 为 主 端 口号 赋值 ， 客 户 向 它 发 出 初始 连接 请 求 ， 然 后 创建 主线 程 启动 服 
务 器 x/ 
error_num= 
pthread create (&main_thread, NULL, (void 
x) serversetup, addr_num)); 
if (error_num! =0) 
/< 产生 线程 执行 函数 serversetup。 第 一 个 参数 是 一 个 指向 线程 ID 的 指针 ， 
第 二 -个 参数 是 一 个 指向 线程 属性 的 指针 ， 在 这 里 用 默认 值 NULL。 第 三 
个 参数 表明 在 线程 创建 后 即将 调用 的 济 数 ， 第 四 个 参数 是 一 个 指向 已 
知 端口 的 指针 */ 
| 
printf ("pthread create failed error: % d\n’, error num); 
exit (1); 
| /x 结束 过 x/ 
else 
| 
printf ("\n\ n\n Server Has Started \ n"); 
| /x 结束 else * / 
do 
(* 显示 并 接受 用 户 的 选择 */ 
| 
printf ("Please input '&' to shutdown the server \n 
& = Server Shutdown \n"); 
scanf ("%s”", memi_option); 
/* RITA Pee x / 
switch (menu_option [0]) 


| 
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case '&’: 
printf ("\n\ n\n Beginning Server 
Shutdown \ n”); 
stop_server (KNOWN_PORT); 
othread_kill_other_threads_np (); 
printf ("Server Shutdown is 
Complete \n"); 
break; 
default: 


printf ("\n\ n\n You selected an invalid option: 


Sc\n, 


menu option [a]); 
break; 
| /x 结束 switch * / 371 
| /x 结束 do-while * / 
while (menu_option [0]! ='s'); 
/# 不 断 循 环 直 到 用 户 选择 惟一 有 效 的 选项 '&' 时 关闭 服务 器 * / 
printf ("Enter 'R' if you would like to print 
reports \ n”); 
print? ("Any other character to quit the 
program \ n”); 
scanf ("%s", munu_option); 
menu_option [0] = -oupper (menu_option [C]); 
if (menu_option [0] = ='R’) 
| 
printf_files (); 
| /x 结束 if*/ 
printf ("Program has exited- Enter ‘'hospitairun’ 
to begin again \ n”); 


| /x 结束 函数 main * / 
A.7.2 Makefile for Server 
# 调度 外 科 手 术 程 序 中 服务 器 端 makefile 的 文件 。 


hospitalrun: inethosp.o serverinit.o hospital.o commonc.o 
cc -o hospitalrun inethosp.o serverinit.o hespital.o commonc.c 
-lpthread 
inethosp.o:commonh.h hospital.h 
serverinit.o: commonh.h hospital.h 
hospital.c: commonh.h hospital.h 
commonc.o: commonh.h hospital.h 
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A.7.3 Hospital.h 
/x* 该 文件 维护 一 些 乡 科 手 术 调 度 程序 中 服务 器 专用 的 文件 和 定义 x*/ 


# include < sys/times.h> 

pthread_mutex_t neuro_room_mutex, 
cardio_room_mutex, 
plastic_room_mutex, 


372 ortho_room_mutex; 
/x pthread 互 斥 信息 ， 每 种 病房 类 型 有 一 个 互 斥 量 ,， 它 一 次 只 允许 一 个 线 
程 访问 其 数据 文件 x*/ 
struct room struct 
/x 用 于 保存 房间 的 有 效 状态 结构 化 格式 x | 
| 
int julian_date; 
/x 手术 的 请 求 日 期 */ 
enum room status status0800; 
/x 特定 时 间 的 有 效 状态 / 
long int ptime0800; 
/* 房间 状态 设置 为 pending REHHADR, SECRTF TPH, MAF 
TATE RA AA RAT E BG He wy Te] BR x / 
enum "dr_id” dr0800; 
/x 选择 房间 状态 为 busy 和 pending 的 客户 和 这， 服务 器 需要 这 个 值 来 跟踪 是 
哪 一 个 用 户 已 经 预约 了 一 个 房间 * / 
enum room status status0900; 
long int ptime090); 
enum “dr_id" dr0900 : 
enum room status statusi000; 
long int ptimel00); 
enum “dr id” dr1000; 
enum room status status1100; 
long int ptimel11i00; 
enum “dr_id” dr1100; 
enum room_status statusi200; 
long int ptimel20); 
enum “dr_id* dr1200; 
enum room status status1300; 
long int ptimel300; 
enum “dr id” dr1300; 
enum room_status statusi400; 
long int ptimel400; 
enum “dr id” @r1400; 
enum room status status1500; 
long int ptime1s00; 
enum “dr_id” dr1500; 
373 enum room_status status1600; 
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long int ptimel600; 
enum “dr_id” dr1600; 


}; 


void serversetup (int *addr_num) ; 


/#x 初始 化 服务 器 和 套 接 字 的 函数 。 传 递 的 参数 是 服务 器 上 一 个 公用 套 接 
字 的 端口 值 。 服 务 器 绑 定 在 已 知 的 端口 ， 持 续 运 行 以 等 待 客户 送 来 的 
数据 恨 。 收 到 数据 报 后 ， 该 函数 产生 一 个 子 线程 处 理 该 请 求 x*/ 
int get _ new port (struct initial connect update_port); 
/* 维护 有 效 客户 的 列表 并 返回 系统 中 为 他 们 保留 的 端口 号 。 传 递 的 参数 
是 一 个 结构 体 变量 ， 它 包含 了 枚 举 类 型 的 用 户 "dr ji 中。 函数 最 后 返回 分 
配给 该 用 户 的 端口 号 */ 
void run request (int *new_add); 
/# 处 理 进 一 步 的 客户 请 求 。 传 递 的 参数 是 一 个 特定 的 端口 号 ， 该 端口 号 
专门 提供 给 客户 请 求 以 和 服务 器 套 接 字 绑 定 。 结 构 体 消息 day_request 
在 客户 和 服务 器 之 间 来 回 传递 。 可 用 的 房间 信息 传递 到 客户 端 ， 客 户 
选择 并 更 新 文件 ， 服 务 器 的 确认 消息 返回 到 客户 端 */ 
int review_rooms (struct day request x request); 
1% 确定 在 客户 要 求 安排 手 术 的 当天 有 哪些 病房 可 用 。 传 递 的 参数 是 指向 
当前 请 求 的 指针 ， 该 请 求 中 的 所 有 将 被 检查 的 时 间 的 状态 都 是 open。 
函数 将 对 当前 请 求 中 那些 不 可 用 的 时 间 状 态 进 行 更 新 ， 可 用 的 时 间 仍 
然 处 于 open 状态 ¥ / 


int select_room (struct day_request * request); 
/Xx 更 新 客户 请 求 房间 的 当天 时 间 的 room_file 文件 。 传 递 的 参数 是 指向 结 
构 体 变量 day_request 的 指针 ， 该 变量 中 有 用 户 的 选择 。 函 数 将 证 实 该 
请 求 中 所 选 的 时 间 是 否 被 认可 ， 并 且 用 保留 的 时 间 更 新 day_requestx / 


int stop_server (irt addr_num); 
/#* 终止 服 务 器 的 函数 。 传 递 的 参数 是 已 知 的 端口 号 。 消 息 用 “master” 作 
为 "dr_id" 来 告诉 服务 器 它 已 经 访问 了 所 有 的 临界 区 ， 要 求 关闭 服务 器 。 
所 有 的 文件 被 关闭 。 最 后 函数 处 于 接收 状态 等 待 表明 服务 器 已 经 关闭 
的 返回 值 */ 
int print_files (); 
/* BRARERZSMEERH, AABKHEDLELSHLH, CAA 
用 户 显示 一 些 提 示 信 息 询问 他 们 需要 显示 哪 一 天 的 哪 一 种 房间 信息 。 
然后 将 相关 的 信息 显示 在 屏幕 上 x/ 
int test pend (enum room_status *this_room_status, 


long int *this_time); 


/x 检查 传递 参数 的 房间 状态 ， 如 果 pending 状态 已 经 结束 ， 则 对 该 消息 更 
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新 。 传 递 的 参数 是 两 个 指针 变量 ， 第 一 个 是 指向 玫 举 类 型 room status 
的 指针 ， 第 二 个 是 指向 房 闻 处 于 那个 状态 的 时 间 的 指针 。 函 数 检查 该 
请 求 是 否 已 超过 了 十 分 名。 如 果 是 ， 则 表明 使 该 时 间 状 态 为 pending 的 
请 求 已 超过 了 十 分 钟 ， 用 状态 值 “open” 更 新 文件 信息 。 如 果 状 态 不 
是 pending 或 pending 状态 的 时 间 小 于 十 分 钟 ， 则 不 做 任何 操作 x / 


int update stat (enum room_status x*request room status, 
eum room status * file room_status, 
long int *this time, 
enum "dr_id” *request_dr; 
enum "dr_id” * file dr); 
/< 根据 数据 文件 的 信息 更 新 被 请 求 房间 的 状态 和 "dr id"。 传 递 的 参数 是 指 
针 变 量 request_room_status 和 "dr_ id'， 以 及 文件 的 时 间 改 和 file_room_sta- 
tus, 44h 4 file_room status 的 值 更 新 这 些 值 1/ 


int select_stat (enum room_status * request_room_status, 
enum room_status * file room status, 

enum "dr_id” * request_dr; 

enum "dr_id” x file dr); 
/x 如 果 发 送 的 消息 中 房间 状态 为 select， 则 函数 更 新 这 个 状态 值 。 传 递 的 
参数 是 指向 room_status AHERE, RRE PRAIA selecto HAAR 
据 下 面 的 信息 更 新 参数 ; 如 果 该 时 间 的 请 求 值 已 被 选择 ， 则 检查 数组 
HAS; 如 果 该 由 刘 是 该 时 间 的 最 后 一 个 古 ， 则 将 此 时 间 更 新 为 busy 

RAS x/ 


A.7.4 Serverinit.c 


/ * serverinit.c #7 344U RF B69 £340, B48) BH: serverinit () */ 
# include "commonh.h” 
/ 关 包 含 所 有 公共 头 文件 和 定义 的 本 地 文件 关 / 
# include "hospital. h” 
Ix 包含 所 有 为 服务 器 端 〈 医 院 ) 专用 的 头 文件 的 本 地 文件 x / 
pthread_t surgeon_thread; 
/x 声明 线程 计 ， 该 线程 在 专用 端口 上 建立 连接 */ 
struct initial_connect initial_request; 
/x 发送 到 服务 器 并 请 求 在 其 专用 端口 上 建立 连接 的 结构 体 消息 x / 
I KRKEKKKKKHKKKKHK KKK serversetup KKK KKH KEKEK KKK K KK KKK KKRHE I 
void serversetup (int * addr_num) 
/* 函数 用 一 个 已 知 端口 值 与 服务 器 套 接 字 绑 定 。 它 首先 等 待 客户 的 请 求 
以 建立 一 个 专用 套 接 字 ， 然 后 产生 子 线程 处 理 请 求 并 将 专用 端口 号 返 
回 给 请 求 服务 的 客户 ， 最 后 它 再 次 回 到 等 待 状态 接收 下 一 个 请 求 */ 
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| 
int known_sock, /# 标志 特定 的 套 接 字 x/ 
server_len, 
/# 表示 服务 器 和 客户 消息 的 长 度 * / 
client_len, 
error _num; 
/x 标志 pthread 创建 过 程 中 的 错误 < / 
int *new_addr; 
/* 用 于 在 pthread_creat 中 传递 新 端口 值 x/ 
struct sockaddr_in server, 
/x 为 服务 器 产生 端口 的 intemet HA * / 
both server, */ 
client; 
1* 为 客户 产生 端口 的 intemet 版 本 x/ 
struct msghdr msg; 377 
/ * 在 sendmsg 中 将 要 使 用 的 结构 体 x / 
struct iovec iov [1]; 
/x 为 sendmsg 存储 数据 和 数据 长 度 信息 的 结构 / 
if ( (known_sock = socket (AF_INET, SOCK_DGRAM, 0)) <0) 
/x 为 该 连接 建立 一 个 套 接 字 。 连 接 范围 是 用 于 连接 不 同 机 器 的 AF_INET 网 
络 。SOCK_DGRAM 是 进行 通信 的 数据 报 形式 。 该 例子 是 非 连接 的 。 第 三 
个 参数 是 使 用 的 协议 ，0 表示 默认 值 x*/ 
| 
perror ("Server Socket”); 
exit (1); 
| /x 结束 if / 
server.sin_family = AF_INET; 
/Xx 建立 internet 类 型 的 连接 x*/ 
server.sin port = htons (*addr_num); 
/1x BEE BHA 4 AE / 
server. sin_addr.s_addr = inet_addr (SERVER_HOST); 
/# 寻找 inet 地 址 ， 主 机 的 确切 地 址 在 文件 commonh.h 中 给 出 * / 
if (bind (known sock, (struct sockaddrx) &server, 
sizeof (server)) <0) 
HERTAKA TRE, GRRE HAA known_sock, &server 
是 服务 器 信息 ， 网 络 名 和 网 络 协议 。 第 三 个 参数 是 指针 的 字 节 数 x / 
| . 
perror ("Server Bind”); 
exit (1); 
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| /x 结束 ifx*/ 
pthread mutex init (&neuro_room_mutex, NULL); 
pthread_mutex_init (&cardio_room_mutex, NULL); 
othread_mutex_init (&plastic_room mutex, NULL); 
pthread_mutex_init (&ortho_room_mutex, NULL); 
/x 为 每 种 房间 类 型 设置 并 初始 化 互 斥 锁 。 它 将 保证 所 有 服务 器 创建 的 线程 
会 对 请 求 线程 进行 初始 化 x/ 
msg. msg name= (char x) &client; 
msg.msg_namelen = sizeof (client); 
msg.msg_iov = Lov; 
msg.msg_iovlen=1; 
msg.msg_control = NULL; 
msg.msg_controllen= 0; 
/* ¥% sendmsg 对 msg 结构 和 iov KAR. msg name 是 可 选择 的 ， 它 表示 接收 者 
的 地 址 《连接 协议 上 不 需要 该 选项 ]。msg namelen = 名 字 的 长 度 ，msg - 
iov = 输入 输出 缓冲 数组 、masg_iovlen = msg iov 中 元 素 的 数量 ，msg_control 
= 辅助 数据 ， 设 置 为 NULL。msg_controllen = 接收 消息 的 结果 值 关 / 
iov [0] .iov_base = &initial_request; 
/x 即将 发 送 的 initial_request 的 地 址 */ 
iov [o] .iov len= sizeof (initial request); 
if (recvmsg (known_sock, &msg, 0) <0) 
/* 接收 来 自 于 客户 端的 消息 。 第 一 个 参数 是 套 接 字 文 件 描述 符 ， 第 二 个 
参数 是 指向 msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 x / 
| 
perror ("Receive Message"); 
exit (1); 
| /x 结束 if*/ 
initial_request.new_port = get new port (initial_request); 
| * # initial_request.new_port 分 配 一 个 与 "dr_id" 相 关 的 值 ， 用 于 告诉 用 户 他 
们 可 在 那个 端口 上 和 服务 器 线程 连接 完成 通信 。 在 进入 下 面 的 循环 前 必 
须 完 成 这 些 操作 ， 接 下 来 进入 while 循环 */ 
while (initial_request.new_port! = 99999) 
/持续 接收 来 自 于 客户 的 请 求 直到 服务 器 用 “master” 作 为 医生 的 ID 发送 
一 条 消息 (get_new_port 返回 99999)。 出 现 这 种 情况 时 ， 一 旦 所 有 互 斥 锁 
在 这 个 线程 控制 之 下 则 该 线程 退出 x/ 
| 
iov [0] .iov base = &initial_request; 
/< 将 被 发 送 的 initial_request 的 地 址 赋值 */ 


iov [0] .iov len= sizeof (initial_request); 
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if (sendmsg (known_sock, smsg, 0) <0) 
/* 发 送 消息 到 客户 端 ， 指 明 新 端口 号 在 msghdr iovec 中 重新 进行 连接 。 第 
一 个 参数 是 套 接 字 文 件 描述 特 ， 第 二 个 参数 是 指向 msghdr 的 指针 ， 第 三 
个 参数 是 一 个 标志 x | 
| 
perror ("Sendmsq”); 
exit (1); 
| /x 结束 fx/ 
if ((new_addr= (int*) malloc (sizeof (int))) = = NULL) 
/x 为 new_port 分 配 内 存 x/ 
| 
perror ("malloc"); 
exit (1); 
| /* 结束 fx/ 
*new addr = initial_request. new_port; 
error_num = 
(pthread_create (&surgon thread, NULL, (void 
*) run_request, new_addr)); 
if (error_num! =0) 

/x È ERRERA BH runrequest， 该 线程 处 理 客 户 进一步 的 请 求 。 第 一 个 
参数 是 一 个 指向 线程 D 的 指针 ， 第 二 个 参数 是 一 个 指向 线程 属性 的 
指针 ， 在 这 里 用 默认 值 “NULL"。 第 三 个 参数 表明 在 线程 创建 后 即将 
调用 的 浮 数 ， 第 四 个 参数 是 一 个 指向 已 知 端口 的 指针 */ 

| 
printf ("pthread create failed error: % d\n", 
error_num); 
exit (1); 
| /x 结束 ifs / 
if (recvmsg (known sock, &msg, 0) <0) 
1* 接收 从 客户 端 发 来 的 消息 。 第 一 个 参数 是 套 接 字 文 件 描述 符 ， 第 二 个 参 
数 是 指向 msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 / 
| 
perror ("Receive Message”); 
exit (1); 
| /* ER if / 
initial_request. new_port = get_new_port (initial request); 
/* 用 分 配给 该 客户 的 端口 号 更 新 initial request 的 端口 值 x/ 
| /x 结束 while */ 
/* 如 果 while 循环 退出 则 表明 已 发 送 了 一 个 数据 报 来 关闭 服务 器 。 函 数 保 
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证 在 服务 器 关闭 之 前 所 有 的 临界 区 已 上 锁 。 若 临界 区 上 锁 ， 则 只 要 有 文 
件 处 于 打开 状态 ， 服务 器 就 不 能 关闭 x*/ 
pthread mutex lock (&neuro_room_mutex); 
pthread mutex lock (&cardio_room_muitex); 
pthread mutex_lock (gplastic room mutex); 
pthread_mutex_lock (&ortho_ room mutex); 
iov [0] .iov base= &initial request; 
Jx A PRR K initial_request 的 地 址 赋值 </ 
iov [0] .iov_len = sizeof (initial request); 
if (sendmsg (known_sock, &msg, 0)<0) 
| 
perror ("Sendmsg Exit of server init”); 
exit (1); 
| /x BBR fx / 
/x% 向 客户 发 回答 复 以 说 明 所 有 临界 区 已 经 上 锁 。 第 一 个 参数 表示 套 接 字 
的 文件 描述 符 ， 第 二 个 参数 是 指向 即将 发 送 消息 的 指针 ， 第 三 个 参数 
是 一 个 标志 ， 设 置 为 0* / 
close (known_soc’s); 
/* RA BRFRARKEME P ARR */ 
pthread_exit ((void *) 0); 
/x* FPR RIE RA + / 
| /x 结束 函数 serversetup * / 


A.7.5 Hospital.c 


/1#“hospital ,c” 维 护 调度 程序 中 服务 器 端 专用 的 函数 。 包 含 的 函数 有 : get_new_port (), 
run_request ()、 review_room ()、 select_room ()、 stop_server ( ) print_files ()、 test_ 
pend ()、 update_stat ()、 select_stat () */ 

# include "commonh.h” 

/# 包含 所 有 公共 头 文 件 的 本 地 文件 */ 

# include “hospital.h” 

/* 包 人 钨 所 有 为 服务 器 端 【《 医 院 ) 专用 的 头 文件 的 本 地 文件 */ 
| HREXKKERERKERKERIN gat NEW _DOTE EK MAK KANE ER EAR EHHR / 

int get_new_port (struct initial_connect update_port) 

/# 维护 有 效 客 户 的 列表 并 返回 系统 中 为 他 们 保留 的 端口 号 。 传 递 的 参数 
是 一 个 结构 体 变量 ， 它 包含 了 枚 举 类 型 的 用 户 dr i。 函数 最 后 返回 分 
配给 该 用 户 的 端口 号 。 
EE: 这 仅仅 是 一 个 简化 的 例子 。 实 际 中 由 于 端口 数 有 限 ， 通 常 选择 端口 的 算法 很 复 
杂 ， 而 且 也 需要 维护 一 个 有 效 的 和 可 用 的 端口 数 的 列表 以 利于 选择 * / 
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| 


int new_port; 
switch (update port. dr_name) 
| 
/ * 当 Williams 的 new_port= 20001 8}, BF x> / 


Case jones: 382 





new_port = 20002; 
break; 
case smith: 
new_port = 20003; 
break; 
case johnson; 
new_port = 20004; 
break; 
case master: 
new_prot = 99999; 
break; 
default: 
new_port = 30000; 
break; 
} /x 结束 switch x / 
return (new_port); 
i; /x 结束 get_new_port * / 
| KEK KKH HK HH HEHEHE HI TUN _TEqUESL HHXHKHK HK KKK HKKKKK AK KX í 
void run_request (int *new_addr) 
/x 处 理 进一步 的 客户 请 求 。 传 递 的 参数 是 一 个 特定 的 端口 号 ， 该 端口 号 专门 
提供 给 客户 请 求 以 和 服务 器 套 接 字 绑 定 。 结 构 体 消息 day_request 在 客户 和 
服务 器 之 司 来 回 传 递 。 可 用 的 房间 信息 传递 到 客户 端 ， 客户 选 择 及 更 新 后 
写 回 文件 ， 服 务 器 的 确认 消息 返回 到 客户 端 */ 
| 
int thread_sock, 
/* 标志 特定 的 套 接 字 x/ 
server_ien, 
/x% 表示 服务 器 和 客户 消息 的 长 度 x/ 
client_len; 
struct day_request: request; 
/x 在 客 户 和 服务 器 之 间 传 递 消息 的 结构 x / 
struct sockaddr_in server, 


/x 为 服务 器 产生 端口 的 intemet MA * / 


264 分 布 式 操作 系统 ; 原理 与 实践 








383 client; 
/x 为 客户 产生 端口 的 intemet HRA * / 
struct msghdr msg; 
/ * 在 senclmsg 中 将 要 使 用 的 结构 体 * / 
struct iovec ioc 1]; 
/* 为 sendmsg 存储 数据 和 数据 长 度 信 息 的 结构 */ 
if ((thread_sock = socket (AF_INET, SOCK_DGRAM, 0)) <0) 
/* 为 该 连接 建立 一 个 套 接 字 。 连 接 范围 是 用 于 连接 不 同 机 器 的 AF_INET 网 
络 。SOCK_DGRAM 是 进行 通信 的 数据 报 形式 。 该 例子 是 非 连 接 的 。 第 三 个 
参数 是 使 用 的 协议 ，0 表示 默认 值 */ 
| 
perror ("Server Socket Error”); 
exit (1); 
| /x 结束 应 */ 
server.sin_family = AF_INET; 
/* 建立 intenet 类 型 的 连接 x/ 
server.sin_port =htons (xnew_addr); /xfix (xnew_port) */ 
/x* 分 配 传 递 给 函数 的 端口 值 */ 
server.sin_addr.s_ addr = inet_addr (SERVER_HOST); 
/* 寻找 inet 地 址 ， 主 机 的 确切 地 址 在 文件 commonh.h 中 给 出 x*/ 
if (bind (thread_sock, (struct sockaddr*«) &server, 
sizeof (server )) <0) 
/x 将 套 接 字 的 值 与 这 个 套 接 字 绑 定 。 该 套 接 字 的 值 是 thead_sock, &server 是 
服务 器 信息 ， 网 络 名 和 网 络 协议 。 第 三 个 参数 是 指针 的 字 节 数 x / 
| 
perror ("Server Bind Error”); 
exit (1); 
| /x 结束 并 x / 
client_len=sizeof (client); 
msg.msg_name= (char *) &client; 
msg.msg_namelen= sizeof (client); 
msg.msg_iov= iov; 
msg.msg_iovlen=1; 
msg.msg_control = NULL; 
msg.msg_controllen = 0; 
/x 为 sendmsg 对 msg 结构 和 iov 赋值 。msg_name 是 可 选择 的 ， 它 表示 接收 者 的 
地 址 (连接 协议 上 不 需要 该 选项 )。msg_namelen = 名 字 的 长 度 ，msg_iov = 
输入 输出 缓冲 数组 ，msg_iovjen = msg_iov 中 元 素 的 数量 ，msg_control = 辅助 
数据 ， 设 置 为 NULL。msg_controllen = 接收 消息 的 结果 值 */ 
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iov [0] .iov base = &request; 
/x 即将 发 送 的 initial_request 的 地 址 x / 
ivo [0] .iov len= sizeof (request); 


if (recvmsg (thread_sock, &msg, 0) <0) 


/x* 接收 来 自 于 客户 端的 消息 。 第 一 个 参数 是 套 接 字 文 件 描述 符 ， 第 二 个 参 


数 是 指向 msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 */ 
| 


perror ("Receive Message”); 
exit (1); 


| 


review_rooms (&request); 


/x* 按 可 用 的 房间 信息 更 新 当前 requestx / 
if (sendmsg (thread_sock, &msg, 0 )<0) 


/* 发 送 消息 到 客户 端 ， 指 明 有 效 时 间 。 第 一 个 参数 是 套 接 字 文 件 描 述 符 ， 第 
二 个 参数 是 指向 msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 x/ 
{ 


perror ("Sendmsg’); 
close (thread_sock); 
exit (1); 


| 


if (recvmsg (thread sock, &msg, 0) <C) 


[* 接收 从 客户 端 发 来 的 消息 。 第 -一 个 参数 是 套 接 字 文 件 描 述 符 ， 第 二 个 参数 
是 指向 msghdr 的 指针 ， 第 三 个 参数 是 一 个 标志 / 

| 

perror ("Receive Message"); 

exit (1); 


| 


select_room (&request); 
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/* 将 发 送 进行 有 效 性 检查 的 消息 并 更 新 相应 的 文件 ， 如 果 用 户 的 选择 被 确 
认 ， 则 用 消 认 状态 更 新 该 消息 x/ 
if (sendmsg (thread_sock, &msg, 0 )< 0) 


/x 向 客户 发 司 答复 表明 所 有 临界 区 已 经 上 锁 。 第 一 个 参数 表示 套 接 宇 的 文件 


描述 符 ， 第 二 个 参数 是 指向 msghdr 的 指针 ， 
| 


perror ("Sendmsg”); 
close (thread_sock); 
exit (1); 


| 


close(thread_sock); 


第 三 个 参数 是 一 个 标志 * / 


oR 


/x 关闭 与 该 套 接 字 文 件 描 述 符 相关 的 连接 x/ 
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pthread_exit(new addr); 
/< 退出 线程 并 调用 相关 的 处 理 #/ 
| / x% 结束 函数 run_request * / 


| XH HRHKHHHXKKK HK KKK PEVIEW _TOOMS 兴 关 兴 兴 兴 兴 闪闪 闪闪 兴 兴 关头 关 闪闪 闪闪 尖 / 
int review_rooms (struct day_request x request ) 
/x 确定 在 客户 要 求 安排 手术 的 当天 有 哪些 病房 可 用 。 传 递 的 参数 是 指向 当前 
请 求 的 指针 ， 该 请 求 中 的 所 有 将 被 检查 的 时 间 的 状态 都 是 opens 函数 将 对 
当前 请 求 中 那些 不 可 用 的 时 间 状 态 进 行 更 新 ， 可 用 的 时 间 仍 然 处 于 open 状 
态 */ 
| 
int i; /* 用 于 遍历 数组 > / 
struct timeval current_time; 
1% 用 于 表明 当前 时 间 和 核对 pending 的 时 间 是 否 大 于 10 分 钟 * / 
char roomtype [25]; 
/#< 表 明 该 数组 中 的 字符 串 为 当前 数组 所 读 的 文件 类 型 */ 
FILE x room_file; 
struct room struct init_room [366]; 
LX 从 文件 中 读数 据 建立 该 结构 ， 并 用 来 根据 需要 进行 读 操作 和 更 新 操作 * / 
switch (request-> surgery_name) 
/x* 判别 用 户 需 要 的 房间 类 型 ， 然 后 打开 与 该 类 型 有 关 的 文件 并 对 该 打开 
的 文件 设置 互 斥 锁 。 x*/ 


case neuro: 
strepy(roomtype, "neuro_rooms.dat") ; 
pthread_mutex_lock (&neuro_room_mutex) ; 
break; 
case cardio: 
strepy(roomtype, "cardio_rooms.dat") ; 
pthread_mutex_lock (&cardio_room_mutex) ; 
break; 
case plastic: 
strepy(roomtype, "plastic _rooms.dat") ; 
pthread_mutex_lock (&plastic_room_mutex) ; 
break; 
case ortho: 
strcpy (roomtype, "ortho _rooms.dat") ; 
pthread_mutex_lock (gortho room mutex); 
break; 
default: 
printf("invalid surgery name \n"); 
exit (1); 


1 /XX 结束 switch * / 
1x 打开 文件 并 建立 结构 体 类 型 room struct HEA * / 
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if ((room_file=fopen (roomtype, “r”)) = = (FILE*) NULL) 
| 
printf ("%s didn't open: %d\r”, roomtype, errno); 
| /x 结束 证 x 1/ 
for (i=1; 365> =i: i ++) 
/* 从 room struct 列表 文件 中 建立 数组 x / 


fread(ginit roomlil, sizeof(init room[i]), 1, room file); 
| /x 结束 forx/ 
i= request-> julia date; 1 387 | 
/* 将 i 设置 成 用 户 选择 的 日 期 */ 
gettimeofday (&current_time, NULL); i 
/x* 取 得 当天 的 当前 时 间 让 用 户 判 断 是 否 pending 状态 已 超过 了 十 分 钟 * / 
test_pend (&init_room [i] .status0800, &init room [i] .ptime0800); 
/ * HRA HH test_pend 并 判断 所 需 房间 的 数值 是 pending 或 更 新 值 。 
函数 将 检查 并 判断 request 是 否 超过 10 分钟 。 如 果 是 ， 则 用 open 更 新 数 
组 ; 如 果 不 是 pending， 或 pending 状态 少 于 10 分 钟 ， 则 以 数组 的 当前 
值 对 它 进行 更 新 。 在 返回 后 ， 客 户 可 判断 哪些 时 间 是 可 用 的 x*/ 


test_pend(&init_room .Status0900, &init_room[i].ptime0900) ; 
( -status1000, sxinit_room[i].ptimel1000) ; 
{ .Status1100, &init_room[i] .ptime1l100) ; 
test_pend(&init_rocm[i] .statusl200, &init_room[i] .ptime1200) ; 
( 
( 
( 


[i 

test_pend(&init_rocm[i 

test_pend(&init_rocm{i].status1300, &init_room[i}.ptime1300); 
i 
i 


test_pend(&init_room[i 
i 
test_pend(&init_room[i].status1400, &init_room[i].ptimel400); 
.Status1500, ainit_room[i] .ptimel500); 
test_pend(&init_room[i].status1600, &init room[i] .ptime1600) ; 
update stat (&request->status0800, 
&init_room[i] .status0800, 
&init_room[i] .ptimedsco, 
&request->dr_ name, 
&init_room[i].dr0800) ; 


/* JM BA update_stat 判断 文件 的 状态 。 如 果 文 件 中 该 时 间 不 可 用 〈 不 处 
于 open RAS), ， 则 函数 用 文件 状态 更 新 request， 这 表明 用 户 对 该 房间 的 
RAE LL, BMH RAH open 并 且 request 中 相关 信息 以 前 没有 从 
open RAAE, MEAKA pending， 这 表明 用 户 所 需求 的 该 时 间 可 
Al. ABEP A 10 分 钟 时 间 对 request 做 出 响应 或 丢弃 它 。 再 用 持 有 该 
时 间 投 的 医生 名 对 文件 更 新 。 该 名 字 仅 仅 允 许 那 个 医生 访问 10 分 钟 x / 
update stat(&request->status0900, 


&init_room[i] .status0900, 
&init_room [i] .ptimeo9co, 


test_pend({&init_rocm[ 








&recuest->dr_name, 
&irit_room[i].đr0900}; 
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update_stat (&request ->status1000, 
&init_room[i].statusiCoo, 
&init_room{i] .ptimelC00 

&request->dr_name, 
&init_room[i].dr10C0); 

update_stat (&request->status1100, 
&init_roomf{i] .status1100, 
&init_room[i] .ptime1100, 

&request->dr_name, 
&init_room[i].dr11¢o); 

update_stat (&request->statusi200, 
&init_room[i}.status1200, 
&init_room[i}] .ptime1z200, 

&request->dr_name, 
&init_room[i].dr12c0); 

update stat (&request->status1300, 
&init_room[i].status1200, 
&init_room{i] .ptimel200, 

&request->dr_name, 
&init_room[i}.dr13C0); 

update stat (&request->status1400, 
&init_room[i].status1400, 
&init_room[i] .ptimel400 

&request->dr_name, 
&init_room[i].dr14C0); 

update stat (&request->status1500, 
&init_room[i] .status1500, 
&init_room[i] .ptimels00, 

&request->dr_name, 
&init_room(i].dr15¢0); 

update stat (&request->statusl1600, 
&init_room[i].status1é00, 
&init_room([i] .Ptimel600， 

&request->dr_name, 
&init_room(i].dr16co); 

fclose(room_file) ; 


/< 关闭 读 状 态 的 文件 ， 重 新 打开 文件 进行 写 操 作 来 更 新 数组 * / 
if ((room_file=fcpen (roomtype,“w’)) = = (FILE x) NULL) 
| 
printf ("% s didn’t open: $d \n”, roomtype, errno); 
| /* PER if*/ 
for (i=1; 365> =i; i ++) 


/* 将 更 新 的 数组 写 回 文件 x*/ 


fwrite(&init room[i], sizeof(init_room[i]), 1, room file); 
| /x% 结束 forx/ 


fclose(room_file); 
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switch(request- > surgery_name) 


/< 判断 需要 哪个 文件 。 解 除 该 文件 上 的 互 斥 锁 允 许 其 它 线 程 访问 x/ 


case neuro: 
pthread_mutex_unlock (&neuro_room_mutex) ; 
break; 
case cardio: 
pthreac_mutex_unlock (&cardio_room_mutex) ; 
break; 
case plastic: 
pthreac._mutex_unlock (&plastic_room_mutex) 
break; 
case ortho: 
pthread mutex unlock (&ortho_room_mutex) ; 
break; 
default: 
printf i "invalid surgery name \n"); 
exit (1); 


| /x 结束 switch * / 


return (0); 
| /* 结束 函数 review_rooms * / 


[| XKKA selECt_ MOM 关 关 兴 关 闪闪 关头 闪闪 兴 关 关头 关 兴 尖 兴 / 
int select_room (struct day_request * request) 
/* 更 新 客户 房间 请 求 当 天 时 间 的 room _file 文件 。 传 递 的 参数 是 指向 结构 体 变 
È day_request 的 指针 ， 该 变量 中 有 用 户 的 选择 。 函 数 将 证 实 该 请 求 中 所 选 |390 
的 时 间 是 否 被 认可 ,并且 用 保留 的 时 间 更 新 day_request。 也 会 用 confimed 
RAH request 以 告诉 用 户 他 的 请 求 已 被 接受 x/ 


int i; /用 来 遍历 索引 x/ 
char roomtype [25]; 
/< 该 数组 中 的 字符 串 表 明 当 前 数组 所 读 的 文件 类 型 * / 
FILE * room_file; 
struct room_struct init_room [366]; 
[* 从 文件 中 读数 据 建立 该 结构 ， 并 根据 需要 进行 读 操作 和 更 新 操作 */ 
switch (request- > surgery_name) 
/判别 用 户 需 要 的 房间 类 型 ， 然 后 打开 与 该 类 型 有 关 的 文件 并 对 该 打开 
的 文件 设置 互 斥 锁 */ 
{ 


case neuro: 


strcepy(roomtype, “neuro_rooms.dat"); 
pthread mutex lock (gneuro rcom mutex) ; 
break; 7 | 
case cardio: 
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strepy(roomtype, "“cardio_rooms.dat"); 


pthread_mutex_lock (&cardio_room_mutex) ; 


break ; 
case plastic: 


strcpy (roomt ype, “plastic_rooms.dat"); 
pthread_mutex_lock (kplastic_room_mutex) ; 


break; 
case ortho: 


strepy(roomtype, "ortho_rooms.dat"); 
pthread_mutex_lock (&ortho_room_mutex) ; 


break; 
default: 


rintf("invalid surgery name \n"!; 
p Y 


exit (1): 


| /x 结束 switch 


if ((room file 


{ 


*/ 


= fopen (roomtype, '"r")) == (FILE *) NULL) 


prirtf("%s didn't open: %d \n", 


| /x eR if */ 


roomtype ,errno) ; 


for (i = 1; 365> =i; i ++) 


/x 


从 room_struct 列表 文件 中 建立 数组 */ 


fread(&init room[i], sizeof(init_room[i]), i, room file); 
1 /x 结束 for */ 


i = request- > julian_date; 


/x* 将 i 设置 成 用 户 选择 的 日 期 x/ 
if (request-> status0800 = = Select) 


/* 


{ 


如 果 request 中 该 时 间 值 已 被 选择 则 检查 数组 的 状态 。 假 如 该 "dr_id" 对 
这 个 时 间 而 言 是 最 后 一 个 ID， 就 将 该 时 间 更 新 为 busy 状态 。 注 意 : 不 
论 何 种 状态 ， 只 要 该 "dr_ id 在 这 个 时 间 段 中 就 可 以 安全 地 分 配 房 闻 。 如 
果 客 户 或 姓名 改变 了 ， 则 没有 人 可 以 请 求 房 间 。 也 就 是 说 ， 一 旦 一 个 
房间 被 选择 ， 则 它 将 不 再 处 于 open 状态 ， 除 非 在 pending 状态 时 "dr_ 让 
发 生变 化 。 另 外 ， 由 于 使 用 了 else- 让 语句 ， 所 以 只 可 接受 每 个 请 求 中 
一 个 选择 * / 


select stat (&request ->status0800, 


1/x ER if */ 


&init_room[i] .status0800, 
&request ->dr_name, 
&init_room[i]} .dr0800) ; 
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else if (request->status0900 == Select) 
select_stat (&request->status0900, 
&init_room[i] .status0900, 
&cequest->dr_ name, 
xkinit_room[i] .dr0900) ; 


| /x 结束 else if */ 
else if (request->status1000 == Select) 
{ 
select_stat (&request->statusl000, 
&init_room(i] .status1000, 
&request->dr_name, 
&init_room([i] .dr1C00) ; 


| /x 结束 else if */ 
else if (request->st:atusil100 == Select) 
{ 
select stat (&request->statusl1100, 
&init_room{i] .statusi100, 
&request->dr_name, 
xinit rooml[li) .dr1100) ; 


| /x 结束 else if */ 
else if (request->status1200 == Select) 


{ 
select stat (&request ->status1200, 
&init_room{i] .status1200, 
&request ->dr_name, 
Sinit_room([i] .dr1200) ; 


| /* 结束 else if x*/ 
else if (request->status1300 == Select) 


{ 


select_stat (&request ->status1300, 
&init_room[i] .status1300, 

&request ->dr_name, 
&init_room(i] .dr1300) ; 


| /* 结束 else if */ 
else if (request->status1400 == Select) 


{ 


select_stat (&request ->statusi400, 
&init_room[i] .status1400, 
&request->dr_ name, 
&init_room[i} .dr1400) ; 


| /x 结束 else if */ 
else if (request->status1500 == Select) 


{ 
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select_stat (&request ->status1500, 
&init_room{i] .status1500, 
&request ->dr name, 
&irit room[i] .dr1500) ; 


| /x 结束 else if x*/ 
else if {request->status1600 == Select) 


{ 


select_stat (&request->statusl600, 
&init_room[i] .status1600, 
&request->dr_name, 
&init_room[{i} .dr1600) ; 


| /x 结束 else if */ 
fclose (room file); 


/¥# 关闭 读 状态 的 文件 ， 重 新 打开 文件 进行 写 操 作 来 更 新 数组 x / 


if ((room_file = fopen (roomtype, "w")) == (FILE *) NULL) 
{ 
printf (" $s didn't open: %d \n", 
roomtype ,errno) ; 


| /x Rif */ 
for (i = 13 365> =i; i ++) 


x% 将 被 更 新 的 数组 写 回 文件 < / 


fwrite(&init room[li], sizeof(init roomli]), 1, room file); 
| /x 结束 ior */ 
fclose (room_file); 
switch (request-> surgery_name) 


/x 判 电 需 要 哪个 文件 。 解 除 该 文件 上 的 互 斥 锁 从 而 允许 其 他 线程 访问 */ 


case neuro: 
pthread_mutex_unlock (&neuro_room_mutex) ; 
break; 
case cardio: 
pthread mutex unlock (&cardio_room_mutex) ; 
break; 
case plastic: 
pthread _mutex_unlock (&plastic_room_mutex) ; 
break; 
case ortho: 
pthread_mutex_unlock (&ortho_room_mutex) ; 
break; 
default: 
printf ("invalid surgery name \n"); 
exit (1); 
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| /x 结束 switch * / 
return (0); 
| /x 结束 函数 select_room * / 


| KKRKK KHER HER KKHK SOP _SEIVEr FXKKKKKKKKAKKK Í 
int stop_server (int addr_num) 
/x 终止 服务 器 的 函数 。 传 递 的 参数 是 与 服务 器 套 接 字 绑 定 的 已 知 端口 号 。 |394 
消息 用 master 作为 dr_name 来 告诉 服务 器 它 已 经 访问 了 所 有 的 临界 区 ， 
从 而 要 求 关 闭 服务 器 。 所 有 的 文件 被 关闭 。 最 后 函数 处 于 接收 状态 等 待 
表明 服务 器 已 经 关闭 的 返回 值 * / 
| 
struct initial_connect stop_request; 
/x* 发 送 到 服务 器 请 求 关闭 服务 器 的 结构 体 消息 x / 
int known_sock, 
/x 标志 特定 的 套 接 字 * / 
server_len; 
/x 表示 服务 器 消息 的 长 度 x/ 
struct sockaddr in server, client; 
1* 为 服务 器 和 客户 产生 端口 的 internet 版 本 x*/ 
struct msghdr msg; 
/< 在 sendmsg 中 将 要 使 用 的 结构 体 x / 
struct iovec iov [:.]; 
/* A sendmsg 存储 数据 和 数据 长 度 信 息 的 结构 */ 
stop_request.dr_name = master; 
/x 用 该 值 表示 已 经 访问 了 所 有 的 临界 区 并 通知 服务 器 进行 关闭 操作 。 在 此 
时 已 关闭 所 有 的 文件 */ 
stop_request.new port = 0; 
/x 在 向 服务 器 发 送 消 息 前 将 request 的 new_port 初始 化 为 0， 可 根据 情况 给 它 
赋予 其 他 的 值 */ 
server.sin_family = AF_INET; 
/ * 建立 internet 类 型 的 连接 x/ 
server.sin_port = htons (addr_num); 
| * 分 配 传 递 给 函数 的 端口 值 x*/ 
server. sin sddr.s addr = inet_addr (SERVER_HOST); 
/* 寻找 inet 地 址 ， 主 机 的 确切 地 址 在 文件 commonh.h 中 给 出 x/ 
if ((known_sock = socket (AF_INET, SOCK_DGRAM, 0)) < 0) 
/# 为 该 连接 建立 一 个 套 接 字 。 连 接 范围 是 用 于 连接 不 同 机 器 的 AF_INET 网 (395 
络 。SOCK_DGRAM 是 进行 通信 的 数据 报 形式 。 该 例子 是 非 连接 的 。 第 三 
个 参数 使 用 的 是 协议 ，0 表示 默认 值 * / 
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perror ("Server Socket Error”); 
exit (1); 
| /* ER if* / 
client.sin_family = AF_INET; 
/ * 建立 intemet 类 型 的 连接 x/ 
client.sin_addr.s_addr = inet_addr (SERVER HOST); 
/* 将 地 址 设置 成 SERVER_HOST， 同 一 台 机 器 用 做 客户 机 和 服务 器 */ 
client .sin port = htons (0); 
/* 默认 值 0 表示 可 连接 到 任何 端口 */ 
if (bind (known_sock, (struct sockaddr * )&client , 
sizeof (client)) < 0) 
/x# 将 套 接 字 的 值 与 这 个 套 接 字 绑 定 。 该 套 接 字 的 值 是 known sock, &client 是 
服务 器 信息 ， 网 络 名 和 网 络 协议 。 第 三 个 参数 是 地 址 的 字 节 数 。 注 意 : 此 
时 的 这 个 调用 函数 中 服务 器 充当 了 客户 机 的 角色 ， 而 在 main thread 中 充当 
了 服务 器 的 角色 x/ 


perror ("Server Bind Error”); 
exit (1); 
| /x 结束 ifx/ 
msg.msg name = (char *) &server; 
msg.msg namelen = sizeof (server); 
msg.msg lov = iov; 
msg.msg iovlen = 1; 
msg.msg_control = NULL; 
msg.msg_ controllen = 0; 


/x 为 sendmsg 对 msg 结构 和 iov 赋值 。msg_name 是 可 选择 的 ， 它 表示 楼 收 者 
的 地 址 (连接 协议 上 不 需要 该 选项 )。msg_namelen = 名 字 的 长 度 ，msg_iov 
= 输入 输出 缓冲 数组 ，msg_iovlen = msg_iov 中 元 素 的 数量 ，msg_control = 
辅 动 数 据 ， 设 置 为 NULL，msg_controllen = 接收 消息 的 结果 值 x / 
iov [0] .iov_base = &stop_request); 
/ * 给 即将 发 送 的 initial_ request 的 地 址 赋值 */ 
iov “0] .lov len = sizeof (stop_request); 
if (sendmsg (know7 sock, &msg, 0) < 0) 
/* 向 服务 器 发 送 消息 ， 用 master 请 求 关 闭 服务 器 ， 传 递 结构 体 变量 表示 返 
回 的 确认 消息 。 第 一 个 参数 是 套 接 字 文 件 描 述 符 ， 第 二 个 参数 是 指向 ms- 
ghdr 的 指针 ， 第 三 个 参数 是 标志 x / 
í 
perror (“Sendmsg in stop_server”); 
exit (1); 
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if (recmsg (known sock, &msg, 0) < 0) 
/* 接收 服务 器 的 消息 。 该 消息 中 的 端口 值 是 99999， 表 示 服 务 器 已 经 关闭 而 
且 所 有 临界 区 已 上 锁 。 第 一 个 参数 是 套 接 字 文 件 描 述 符 ， 第 二 个 参数 是 
指向 msghdr 的 指针 ， 第 三 个 参数 是 标志 x/ 


peeror ("Client Recvmsg Error”); 
close (known_sock); 
exit (1); 
| /x 结束 if */ 
close (known_sock); 
/* 关闭 套 接 宇 ， 不 再 为 该 客户 事务 服务 * / 
return (stop request.new port); 
/* 返回 值 99999 作为 标志 ， 表 明 master "dr_id" 将 进行 终止 服务 器 操作 * / 
| / x 945% H Ak stop_server * / 


| KXKKHRKHKHHKHKKHKES print files HHH KKK HK HERKEN / 
int print_files () 
/* BK ARERF SMELL, AA BKHRLELHLH, CARE 
一 些 提示 消息 以 询问 用 户 需要 显示 哪 一 天 的 哪 一 种 房间 信息 ， 然 后 将 相 [397] 
关 的 信息 显示 在 屏幕 上 x / 


enum surgery_type surg_type; 
/* 稍 后 将 为 用 户 显示 文件 的 类 型 */ 
char user_select [1], 
null_value [1]; 
/* 接受 用 户 的 输入 x*/ 
int i; /# 用 来 遍历 数组 * / 
FILE x room_file; 
char this_file [25]; 
/* AREER SF x / 
struct room_struct :nit room [366]; 
1 x Fife Be A RR A G eR x / 
do / % 持续 循环 直到 用 户 要 求 退 出 * / 


Go 1/#* 持 续 循 环 直 到 用 户 作 出 有 效 选择 * / 


printf("Which file would you like to print 
from? \n")j; 

printf("Please enter the appropriate character 
> \n"); 

printf (" 
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A = Neurclogical Rooms \n 

B = Cardiovascular Rooms \n 
C = Orthopedic Rooms \n 

D = Plastics Rooms \n 

Z = EXIT \n"); 


scanf ("%s",user_ select); 
user_select[0] = toupper(user_select[0]); 


switch(user_select [0] ) 


/# 根 据 用 户 选择 对 surg_type 赋值 并 复制 所 需 打 开 的 文件 名 4/ 


case 'A': strepy(this_file,"neurc_rooms.dat") ; 
surg_type = neuro; 
break; 
case 'B'; strepy(this_ file, "cardio_rooms.dat"); 
surg_type = cardio; 
break; 
case 'C': strepy(this file, "ortho_rooms.dat") ; 
surg type = ortho; 
break; 
case 'D': strepy(this file, "plastic_rooms.dat"); 
surg type = plastic; 


break; 

case 'Z': printf ("Exiting Print Program \n") ; 
break; 

default: printf("This Option is Invalid \n"); 
break; 


| / * 结束 switch * / 
| /x 结束 do-while * / 


while ((user_select [0] ! = ’A') 

/# 持 续 循 环 直到 作出 有 效 选择 * / 

&& (user_select [0]! = 'B’) 

&& (user_select [0]! = 'c’) 

&& (user_select [0]! = 'D') 

&& (user select [0]! = 'z')); 
/x* 打开 所 需 的 文件 建立 数组 以 允许 用 户 对 日 期 和 显示 数据 作出 选择 x/ 

if ( user select [0] != 'Z') 
ve {(room_file = fopen (this file, "r")} == (FILE *) NULL) 
{ 


printf ("ts didn't open: td \n ", this_file, errno); 


| /x 结束 ifx/ 
for (i = 1; 365 >= i ; i++} 


{ 


fread(&init_room{i], sizeof(init_room[i}), 1, room_file); 
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' {x 结束 for * / 


do 
{ 





printf ("What day would you like to look at? \n"); 


scanf ("%d", &i); 


| /x 结束 do-while * / 
while ( (i <1) II (i>365)); 


/x 获得 用 户 需 要 显示 的 日 期 。While HAREM AY FE 1 到 365 之 间 。i 


= 1 表示 Julian 年 的 第 一 天 * / 


/x 调用 相关 的 议 数 显示 所 需 的 数据 x / 


printf ("Surgery date: sd", init_room[:] .julian_date) 


printf (" Room Type "+; 
print_type(surg_type!; 

printf ("Room Status: \n "); 

printf (" C8:00 - "); 
print_status(init_room[i] .status0800) ; 
printf ("Dr. "); 
print_dr(init_room[i].dr0800); 
printf (" 09:00 - "); 
print_status(init_room[{i] .status0900); 


printf("Dr. "); 
print_dr(init_room[i].dr0900); , 
printf(" 10:00 - "); 


print_status(init_room/{i} .status1000) ; 
printf ("Dr. "); 
print_dr(init_room[i].dr1000); 
printf(" 11:00 - "); 
print_status(init_rcom[{i] .status1100) : 


printf ("Dr. "); 
print_dr(init_room[(i].dr1100); 
printf (" 12:00 - "); 
print_status(init_rcom[i] .status1200) ; 
printf ("Dr. "); 


print_dr(init_room[i] .dr1200); 
printf(" 13:00 - "); 
print_status(init_room[i}.status1300) ; 


printf ("Dr. "); 

print_dr(init_room[i] .dr1300); 
printf (" 14:00 - "); 

print_status (init_room[i] .status1400) ; 
printf (Dr. "); 


print_dr(init_room{i].dr1400); 
printf(" 15:00 - "); 
print_status(init_room[i] .status1500) ; 
printf ("Dr. "); 

print_dr(init_room[i] .dr1500); 
printf (" 16:00 - "); 
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print_status(init_room[i] .status1600) ; 

printf ("Dr. "); 

print_dr(init_rocm[i].dr1600); 

printf (" \n This is the status of the room you requested."); 
printf ("ENTER any character to continue \n"); 

scanf ("$s",null value) ; 

printf ("\n\n\n") ; 

fclose (room_file); 


/* 在 显示 完 toom_struct 后 ， 重 新 回 到 do-while 循环 中 ， 人 允许 用 户 选 择 另 一 天 


和 另 一 种 类 型 或 选择 退出 */ 
| /x 结束 if / 
| / * 结束 do-while x / 


while (user select [0]! ='2'); 


return (0); 


1 


| /* 结束 函数 print_files * / 


| HRKHKHKHKKEKKRKKKEK test pend KKEKKHKK KKK HKHHKKK KIN / 


int test_pend (enum room_status «this room status, 


| 


long int xthis time) 

/< 检查 传递 参数 的 房间 状态 ， 如 果 pending 状态 已 经 结束 ， 则 对 该 消息 更 
新 。 传 递 的 参数 是 两 个 指针 变量 ， 第 一 个 是 指向 枚 举 类 型 room status 的 
指针 ， 第 二 个 是 指向 房间 处 于 那个 状态 的 时 间 的 指针 。 函 数 检查 该 请 求 
是 否 已 超过 了 10 分 钟 。 如 果 是 ， 则 表明 使 该 时 间 的 状态 为 pending 的 请 求 
已 超过 了 10 分 钟 ， 用 状态 值 open 更 新 文件 信息 ; 如 果 状 态 不 是 pending 
或 pending 状态 的 时 间 小 于 10 分 钟 ， 则 不 做 任何 操作 * / 


struct timeval current_time; 


/* 用 于 表明 当前 时 间 并 核对 是 否 pending 状态 的 时 间 超 过 10 分 钟 x / 


gettimeofday (&current_time, NULL); 


/x* 取得 当天 的 当前 时 间 让 用 户 判 断 是 否 pending 状态 已 超过 了 10 分 钟 */ 


if (xthis room status = = pending) 


/* 如 果 被 请 求 的 房间 状态 为 pending， 则 判别 时 间 请 求 是 否 已 超过 10 分 钟 。 
HE, MAMAN MAA pending 的 请 求 已 超时 ， 则 将 文件 更 新 为 
open 。 如 果 状 态 不 是 pending, A pending 的 状态 不 超过 10 分 钟 ， 则 用 当前 
数组 中 的 信息 更 新 request。 在 该 消息 返回 客户 端 后 ， 客 户 可 判断 哪些 时 
间 是 可 用 的 x*/ 
| 
if ( (current:_time.tv_sec- wthis time) > 600) 
/* 如 果 . 将 房间 设置 成 pending 状态 已 超过 10 分 钟 ， 则 将 状态 更 新 为 open 并 
将 时 间 著 改 为 当前 时 间 */ 
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*xthis time = current_time. tv_sec; 
*xthis_room_status = open; 
| /x 结束 fe / 
| /x 结束 if / 
return (0); 
| /x 结束 函数 test_pendx / 
| 兴 兴 关 基 关头 闪闪 闪闪 关 关 关头 兴 关 共 兴 update Stat 关头 关头 关 关 兴 关 闪闪 闪光 关 关 兴 关 尖 关 / 
int update_stat (enum room_status *request_room_status, 
enum room_status * file room_status, 
long int *this_time, 
enum "dr_id” *request_dr, 
enum "“dr_id” x file_dr) 
| * 根据 数据 文件 的 信息 更 新 被 请 求 房间 的 状态 和 "dr_id"。 传 递 的 参数 是 指针 
变量 request_room_status 和 "dr_ id， 以 及 文件 的 时 间 蕉 和 file room status, & 
数 根 据 fils_room_status 的 值 更 新 这 些 值 */ 
struct timeval current time; 
/# 用 于 表明 当前 时 间 和 核对 pending 的 时 间 是 否 超过 10 分 钟 */ 
gettimeofday (&current_time, NULL); 
/* 取得 当天 的 当前 时 间 以 得 到 pending 4R As 44 HY Te] BR x / 
if (* file room status { = open) 
/* 如 果 文 件 中 该 时 间 不 可 用 (不 处 于 open 状态 )， 则 用 当前 的 状态 更 新 re- 
quest。 这 将 告诉 用 户 所 选 的 房间 不 可 用 x%/ 


*request room status = x file room status; 
| /x 结束 这 x/ 
else if (xfile room status = = open) 
/x* 车 该 房间 状态 为 open 并 且 此 前 request 中 相关 信息 没有 从 oen 状态 改变 ， 
则 将 数组 写 为 pending， 这 表明 用 户 所 需求 的 该 时 间 可 用 。 然 后 客户 有 10 
分 钟 时 间 对 request 做 出 响应 或 丢弃 它 。 再 用 持 有 该 时 间 段 的 医生 名 更 新 文 
件 。 该 名 字 仅 仅 允许 那个 医生 访问 10 分 钟 / 


*file_room_status = pending; 
*this time = current_time.tv_sec; 
xfile_dr = *request_dr; 

| /x 结束 if*/ 

return (0); 


| /x 结束 函数 update_stat * / 


| 尖 尖 关头 关 尖 关 兴 关 共 关 兴 尖 关 尖 其 尖 关 select stat HHH EE / 


402 


280 ARERR: 原理 与 实践 


int select_stat (enum room status *request_room_status, 
enum room_status *file room_status, 
enum “dr_id” *request_dr, 


enum “dr_id” *file dr) 


/x 如 果 发 送 的 消息 中 房间 状态 为 select， 则 函数 更 新 这 个 状态 值 。 传 递 的 参数 
是 指向 room _status 的 指针 变量 ， 该 变量 中 状态 值 为 select。 函 数 根 据 下 面 的 
信息 更 新 参数 : 如 果 已 选择 该 时 间 的 请 求 值 ， 则 检查 数组 的 状态 。 如 果 该 
“dr _ijid' 是 该 时 间 的 最 后 一 个 七 ， 则 将 此 时 间 更 新 为 busy KA * / 


if (*file dr == *request_dr) 


{ 


*file room_status = busy; 


*request_room_status = confirm; 


| /x BER if*/ 
else 


{ 


*request. room status = busy; 


| /x 结束 else * / 
return (0); 


| /* 结束 函数 select_stat x / 
A.8 Common Source Code 


A.8.1  Commonh.h 


/x commonh .h 文件 用 于 维护 一 些 外科 手 本 调度 程序 中 客户 端 和 服务 器 公用 的 头 文件 和 定 
义 。 该 程序 是 John A.Fritz 在 Dr.D.L.Galli 的 指导 下 完成 x*/ 

# include <pthread.h> 

# include <stdio.h> 

# include <stdlib.h> 

# include <unistd.h> 

# include <errno.h> 

# include <string.h> 

# include < sys/socket .Ph > 

# include < sys/tvpes.h> 

# include <netinet/in.h> 

# include < arpa/inet.h> 

# include <netdb.h> 

# include < sys/time.h> 


# define SERVER_HOST "??? .?.?..? ” 
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(* 用 做 医院 服务 器 的 主机 IP 地址。 注意 : CRA CMA! */ 
# define KNOWN_PORT 20000 
(* 与 服务 器 连接 的 已 知 端口 号 * / 
enum surgery_type {reuro, cardio, plastic, ortho}; 
/x 手 术 的 类 型 ， 根 据 该 类 型 分 配 相 应 的 房 闻 */ 
enum dr id" |williams, jones, smith, johnson, master, none|; 
/x 允许 在 医院 中 进行 活动 的 医生 的 标志 。Master 在 服务 器 端 主 函 数 中 告诉 
服务 器 进行 关闭 操作 xx/ 
enum room_status {busy, open, pending, Select, confirm ; 
/x* 某 时 间 所 有 可 能 的 状态 。 时 间 提 交 时 为 busy; BH TAM A open; 
时 间 已 被 另 一 个 医生 选择 时 为 pending; Select 用 来 表示 医生 根据 有 效 状 
态 所 选择 的 时 间 ; confirm 告诉 医生 医院 已 经 处 理 并 确认 了 该 选择 x/ 
struct initial connect 


1/x# 从容 户 端 发 出 初始 请 求 的 结构 体 x / 


enum "dr_id” dr name; 
/1% 发 出 请 求 的 客户 id*/ 
int new port;  /* 从 服务 器 返回 到 客户 端 用 于 进一步 通信 的 端口 号 。 最 初 发 送 到 
服务 器 时 它 应 该 初始 化 为 0* / 
}; 
struct day_request 
/1* 在 客户 和 服务 器 之 间 传 递 信息 的 结构 体 / 
| 
enum "dr_id” dr_rame; 
/1#* 发 出 请 求 的 客户 id */ 
enum surgery_ty ve surgery_name; 
(x 将 安排 的 手术 的 名 字 */ 
int julian_date; 
/x 手术 的 日 期 */ 
enum room status status0800; 
/x* 某 个 特定 时 间 的 有 效 性 状态 */ 
enum room_staztus status0900; 
enum room_status status1000; 
enum room_status status1100; 
enum room_status status1i200; 
enum room_status status1300; 
enum room_status status1400; 
enum room_status status1500; 


enum room_status status1600; 405 
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E 
int print_day_request (struct day_request request); 
/* 显示 day_request 类 型 请 求 信 息 的 画 数 。 传 递 的 参数 是 结构 体 类 型 day_ 
request 的 变量 。 该 结构 的 一 些 状态 将 被 显示 出 来 */ 
int print_status (enum room status this_room_status); 
/< 显示 房间 状态 的 函数 。 传 递 的 参数 是 结构 体 类 型 room_status 的 变量 ， 
将 显示 其 中 的 一 些 状态 * / 
int print dr (enum "aqr_ ia" this_dr); 
/* 显示 dr name 的 函数 。 传 递 的 参数 是 枚 举 类 型 "dr id’ EE * / 
int print_type (enum srugery type this_type); 
[x 显示 手术 类 型 的 函数 。 传 递 的 参数 是 结构 体 类 型 surgery_type 交 量 */ 


A.8.2 Commonc.c 


/ * "commonc,c" 文 件 包 含 调 度 程序 中 服务 器 和 客户 端 公用 的 函数 。 包 括 的 函数 有 : 
print_day_request ()、 print_status ()、 print_dr ()、 print_type () */ 
# include "commonh. h” 
int print _day_reqiest (struct day_request request) 
/* 显示 day_request 类 型 请 求 信 息 的 函数 。 传 递 的 参数 是 结构 体 类 型 day_ 
request 的 变量 。 该 结构 的 一 些 状态 将 被 显示 出 来 x*/ 


printf ("\n\n\n\n Surgeon Name: Dr. "); 
print_dr(request.dr_name) ; 

printf ("Surgery Type: "); 
print_type(request.surgery_name) ; 

printf ("Surgery date: $d \n ", request. julian_date) ; 


/显示 房间 状态 的 shell， 将 枚 举 类 型 room_status 变量 传递 到 函数 print_sta- 
tus * / 


printf ("Room Status: \n "); 
printf(" 08:00 - "); 

print _status (request .status0800) ; 
printf(" 09:00 - "); 
print_status (request .status0900) ; 
printf (" 10:00 - "); 
print_status (request .status1000) ; 
printf(" 11:00 - "); 

print status (request .status1100) ; 
printf(" 12:00 - "); 
print_status (request .status1200) ; 
printf(" 13:00 - "); 

print status (request .status1300) ; 
printf(" 14:00 - "); 

print _status(request.status1400) ; 
printf(" 15:00 - "); 
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print status (request.status1500) ; 

printf(" 16:00 - "); 
print_status (request .status1600) ; 

return (0); 

| /* 结束 函数 print_dey_request * / 

int print _status (enum room_status this_room_status) 


/x 显示 启 间 状态 的 浮 数 。 传 递 的 参数 是 结构 体 类 型 room status 4 KE * / 


switch (this_room status) 
/* 测试 mom staus 并 显示 相关 的 名 字 。 如 果 该 名 字 不 在 列表 之 中 ， 这 个 
错误 并 不 严重 ， 程 序 不 会 退出 。 函 数 将 会 显示 出 空白 的 状态 值 */ 


{ 

case busy: printf("Busy \n"); 
break; 

case open: printf("Open \n"); 
break; 407 

case pending: printf("Pending \n") ; 
break; 

case Select: printf ("Select \n"); 
break; 

case confirm: printf("Confirmed \n"); 
break; 

} /* end switch */ 

return (0); 


| /x 结束 函数 print_status * / 
int print dr (enum "dr_id” this_dr) 
/* 显示 dr name th BKM, SPMHFKABBKM"dr_ id’ EF * / 


switch (this_dr) 
/* 测试 this dr FLRMAHLF, WREAFREWKAZLP, RPK 
是 严重 的 ， 文 件 需要 在 退出 程序 后 立即 进行 更 新 。 显 然 这 需要 加 强 专 
业 能 为 ， 在 这 里 为 了 简化 和 减 小 空间 而 仅仅 用 了 最 基本 的 方法 */ 


case smith : printf ("Smith \n"); 
break; 
case jones : printf ("Jones \n"); 
break; 
case johnson : printf("Johnson \n"); 
break; 
case williams : printf("Williams \n"); 
break; 
case none : printf("None \n"); 
break; 
default: printf("Invalid Dr name \n"); 
exit(1); 
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| /x 


结束 switch * / 


return (0); 
| /x RBH print_dr * / 
int print_type (enum surgery_type this_ type) 


| 


IX 显示 手术 类 型 的 函数 。 传 递 的 参数 是 结构 体 类 型 surgery_type 变量 x*/ 


switch (this_type) 


case 


case 


case 


case 


/x 测试 surgery_name 并 显示 相关 的 名 字 。 如 果 该 名 字 不 在 列表 之 中 ， 这 个 
错误 是 严重 的 ， 文件 需 要 在 退出 程序 后 立即 进行 更 新 */ 


neuro : printf ("Neurological \n"); 
break; 

cardio : printf("Cardio Vascular \n"); 
break; 

plastic : printf ("Plastic \n" ); 
break; 

ortho : printf ("Orthopedic \n"); 
break; 


default: printf ("Invalid Surgery Type \n"); 


exit(1); 


| /x 结束 switch * / 


return (0); 


| /x 结束 函数 print_type * / 
A.9 文件 初始 化 源 代码 : WRITE_CA.C 


/ * ”write_ca.c" 文 件 包 含 初始 化 外 科 手 术 调 度 程序 中 服务 器 所 使 用 的 数据 文件 的 水 数 。 


程序 将 建立 rom struct 类 型 的 数组 并 将 信息 写 回 到 用 户 选 择 的 文件 中 。 程 序 结束 后 建立 相应 
的 文件 。 该 程序 是 JohnA.Aritz 在 Dr.D.L.Galli 的 指导 下 完成 */ 


# include commont h” 


/< 包含 所 有 公共 头 文 件 和 定义 的 本 地 文件 <1/ 


# include "hospital. h” 


/类 包含 所 有 公共 头 文件 和 定义 的 本 地 文件 ， 尤 其 是 为 服务 器 所 专用 的 头 
文件 和 定义 x/ 


XKXKKKKRKKKKAKAE Main HHH KEK HHH / 


void main () 


| 


char user select [1], 


/x* HAM P R 
this_file [25]; 


1x 存储 文件 名 字符 串 */ 


int 4; /用 来 遍历 数组 x, 
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struct timeval current _time; 
/XX 和 包含 当前 时 间 的 结构 体 x*/ 
FILE x room_file; 
struct room struct init_room [366]; 
/%* 保 存 房间 有 效 信 息 的 结构 体 数 组 x/ 
printf ("\n\n\r “Which file would you like to initialize? \n"); 
do /# 循环 直到 用 户 要 求 退 出 */ 
| 
do x 循环 直到 用 户 作出 有 效 选择 */ 


{ 

printf ("Please enter the appropriate character: \n "); 
printf (" 

= Neurological Rooms \n 

= Cardiovascular Rooms \n 

= Orthopedic Rooms \n 

= Plastics Rooms \n 

= EXIT \n"); 

scanf("%s",user select); 


NOOO DO P 


/x* 检索 用 户 输入 并 将 它 改 成 大 写 形式 */ 
user select[0] = tousper(user select'0]); 


switch(user select[0]) 


[x 让 用 户 选 择 要 初始 化 的 文件 ， 并 将 文件 名 复制 到 this_file. this_file 将 用 于 


打开 文件 进行 写 操作 x/ 
{ 

case 'A': strepy(this_ file, "neurc_rooms.dat") ; 
break; 

case 'B': strepy(this_ file,"cardio_rooms.dat") ; 
break; 

case 'C': strepy(this file, "orthe_rooms.dat") ; 
break; 

case 'D': strcepy(this_file,"plastic_rooms.dat"); 
break; 

case 'Z': printf("Exiting File Init Program \n") ; 
break; 

default: printf("This Option is Invalid \n"); 
break; 


| /x 结束 switch * / 
| /x 结束 do-while * / 


while((user_select[0] ! = 'a') 
/* 持续 循环 直到 做 出 选择 */ 
&& (user select [0]! = 'B’) 
&& (user_select [0]! = ’c’) 


&& (user_select .0]! = ’D’) 





410 


411 


286 DRPKREARA: RESER 











&& (user select [0]! = 'z')); 
if (user select [0] ! = '2’) 
/* 选择 必须 有 效 。 如 果 不 是 'Z'， 则 打开 文件 建立 数组 并 进行 写 操作 +*/ 
{ 


if ((room_file = fopen (this file, "w")) == 
(FILE *) NULL) 


{ 
printf(" $s didn't open %d \n", 
this_file,errno) ; 
exit (1); 


| /x 结束 if / 
for (i=1; 365 >=i; i ++) 
{ 
init_room [i] .julian aate= i; 
/# 填写 一 年 的 julian_date 中 要 求 的 手术 的 日 期 〔 国 年 不 考虑 ) x / 
init_room [i] .status0800 = open; 
/x* 在 某 个 特定 时 间 的 有 效 性 状态 最 初 都 初始 化 为 open， 当 程序 运行 时 将 根据 
当前 值 进行 更 新 ,更 新 的 值 还 将 写 回 到 文件 中 x/ 
init_room [i] .status0900 = open ; 
init_room [i] .status1000 = open ; 
init_room [i] -Status1100 = open ; 
init_room [i] .status1200 = open ; 
init_room [i] .status1300 = open ; 
init_room [i] .status1400 = open ; 
init_room [i] .status1500 = open ; 
init_room [i] .status1600 = open ; 
gettimeofday (&current_time, NULL) ; 
/x 调用 函 救 得 到 当前 时 间 用 来 为 时 间 段 设置 一 些 值 */ 
init_room [i] .ptime0800 = current_time. tv_sec; 
/* 标志 房间 被 设置 成 pending RAM HMR, tRHYRAF 10 分 钟 ， 则 用 在 
那个 时 间 的 下 一 个 请 求 有 效 消息 重新 设置 该 值 */ 
init room [i] .ptime0900 = current_time. tv_sec ; 
init_room [i] .ptime1000 = current_time. tv_sec ; 
init_room [i] .ptime1100 = current_time. tv_sec ; 
init_room [i] .ptime1200 = current_time. tv_sec ; 
init_room [i] .ptimel300 = current time. tv_sec; 
init_room [i] .ptimel400 = current_time. tv_sec ; 
init_room [i] .ptimel500 = current_time. tv_sec; 
init_room [i] .ptimel600 = current time. tv_sec; 
init_room [i] .Gr0800 =none ; 


1% 特定 时 间 的 dr id。 将 所 有 的 值 都 初始 化 为 none。 当 程序 运行 时 用 当前 的 值 
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进行 更 新 并 将 更 新 的 值 写 回 文 件 */ 


init_room [i] .dc0900 =none ; 


init_room [i] 
init_room [i] 
init_room [i] 
init_room [i] 
init_room [i] 
init_room [i] 


init_room [i] 


.dr1000 =none ; 
.G11100 = none ; 
.dr1200 =none ; 
.d11300 =none ; 
.d11400 = none ; 
.dr1500 = none ; 
.d11600 = none ; 


fwritel&init_rooml i], sizeof(init_roomli]), 1, 
room_file); 
| /x 结束 for */ 
printf ("\n\n\n %s has been initialized \ n”, this file); 
printf (” Would you like to initialize another? \n”); 
fclose (room_file); 
| /x 结束 让 x/ 
| /x 结束 dowhile * / 
while (user_select [0]! = 'z'); 
/< 持续 初始 们 文件 直到 用 户 退 出 * / 


| /* 结束 main x / 
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缩写 词 表 


AAL (ATM Adaptation Layer) ATM 适 配 层 

ACID (Atomicity, Consistency, Isolation, Durability (properties of a transaction)) 原子 性 ， 一致 
性 ， 独 立 性 ， 持 久 性 (CRS BRE) 

ACL (Access Control Lists) ”访问 控制 表 

ACM (Association for Computing Machinery) ” 计算 机 械 协 会 

ACPI (Advanced Configuration and Power Interface) 高 级 配置 和 电源 接口 

AFS (Andrew File System) ”Andrew 文件 系统 

API (Application Programming Interface) ”应 用 程序 设计 接口 

APM (Advanced Power Maragement) ”高 级 电源 管理 

APPN (Advanced Peer-to-Peer Network) ”高 级 对 等 网 络 

ARPANET (Advanced Army Research Projects Network) ”高 级 军队 研究 项 目 网 络 

ASCII (American Standard Code of Information Interchange) ”美国 信息 变换 标准 代码 

ATM (Asynchronous Transfer Mode) ”异步 传输 模式 

BOA (Basic Object Adapter (CORBA)) ”基本 对 象 适配器 (CORBA) 

BSD (Berkeley Software Distribution) Berkeley CARE) 软件 发 布 RA) 

CCITT (intl. Telegraph & Telephone Consultative Committee (now ITU-T)) ”国际 电报 电话 协调 
委员 会 (Me ITU-T) 

CDFS (Compact Disk File System) ”密集 磁盘 文件 系统 

COM (Component Object Model) ” 组件 对 象 模 型 

COOL (Chorus Object-Oriented Layer) Chorus 面向 对 象 层 

CORBA (Common Object Request Broker Architecture) ”公共 对 象 请 求 代理 结构 

CSMA/CD (Carrier Sensitive Multiple Access with Collision Detection) 载波 侦 听 多 路 存 取 / 冲 突 
检测 

DAP (Directory Access Protocol) ”目录 访问 协议 

DARPA (Defense Advanced Research Projects Agency) ”国防 部 高 级 研究 计划 局 

DCE (Distributed Computing Environment) ”分 布 式 计算 环境 

DCOM (Distributed Component Object Model) ”分 布 式 组 件 对 象 模型 

DNS (Directory Name Service) ”目录 名 服务 

DES (Data Encryption Standard) ”数据 加 密 标 准 

DFS (Distributed File System (Windows 2000)) ”分 布 式 文件 系统 (Windows 2000) 

DIB (Directory Information Base (X.500)) ”目录 信息 库 (X.500) 

DISP (Directory Information Shadowing Protocol) ”目录 信息 映射 协议 

DIT (Directory Information Tree (X.500)) ”目录 信息 树 (X.500) 

DLL (Dynamic Link Library) ”动态 链接 库 
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DNS (Distributed Name System, Domain Name System (or Server)) 分布 式 名 字 系 统 ， 域 名 系 
统 (or 服务 器 ) 

DoD (Department of Defense) 国防 部 

DSM (Distributed Shared Memory) ”分 布 式 共享 内 存 

DSP (Directory System Protocol) ”目录 系统 协议 

DPC (Deferred Procedure Call (Windows 2000)) ”延迟 过 程 调用 (Windows 2000) 

DVD (Officially not an acronym, although once stood for Digital Video Disk) “并 非 正 式 的 简写 词 ， 
一 般 代 表 数 字 视 频 盘 

EBCDIC (Extended Binary-Coded Decimal Interchange Code) ”扩充 二 一 十 进 制 交换 码 

EDR (External Data Representation) ”扩展 数据 表示 

EFS (Encrypting File System (Windows 2000)) ”加 密 文件 系统 (Windows 2000) 

FAT (File Allocation Table) ”文件 分 配 表 

FAQ (Frequently Asked Questions) ”常见 问题 

FDO (Functional Device Objects (Windows 2000)) ”功能 设备 对 象 (Windows 2000) 

FDDI (Fiber Distributed Data Interface) ”光缆 分 布 式 数据 接口 

FEK (File Encrypting Key) 34E 4H 

FIFO (First In First Out) ”先进 先 出 

FTP (File Transfer Protocol) ”文件 传输 协议 

GEOS (Geostationary Operational Environmental Satellites) ”卫星 地 面 站 操作 环境 

GSM (Global System for Mobile Communications ) 移动 通信 全 球 系统 

GUI (Graphical User Interface) ”图 形 用 户 界面 

HAL (Hardware Abstraction Layer (Windows 2000)) ”硬件 抽象 层 (Windows 2000) 

HTML (Hyper Text Markup Language) ” 超 文 本 标记 语言 

HTTP (Hypertext Transfer Protocol) ” 超 文本 传输 协议 

ICMP (Internet Control Message Protocol) ”网 际 控制 报 文 协议 

IDL (Interface Definition Language) ”接口 定义 语言 

IETF (Internet Engineering Task Force) ”因特网 工程 任务 组 

IGMP (Intemet Group Management Protocol) ”网 际 管理 协议 

IIS (Intemet Information Service) ”因特网 信息 服务 

IP (internet Protocol) ”因特网 协议 

IPC (InterProcess Communication) ”进程 间 通 信 

IRP (LO Request Packets) ”输入 输出 请 求 包 

ISO/OSI (International Standards Organization/Open System Intemconnection) 国际 标准 化 组 织 / 
开放 系统 互联 

ITU-T (Intemational Telecommunications Union-Telecommunication (sector)) ”国际 电信 联盟 - 远 
程 通信 部 

IVR (Interactive Voice Response) ”交互 声音 响应 

KDMB (Kerberos Database Management System) Kerberos 数据 库 管 理 系统 

LDAP (Lightweight Directory Access Protocol) ”轻便 目录 访问 协议 
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LPC (Local Procedure Call) ”本 地 过 程 调用 

MIMD (Multiple Instructior: Stream, Multiple Data Stream) ”多 指令 流 ， 多 数据 流 

MISD (Multiple Instruction Stream, Single Data Stream) ”多 指令 流 ， 单 数据 流 

MMC (Microsoft Management Console) ”微软 管理 控制 台 

MMU (Memory Management Unit) ”内 存 管理 单元 

NBS (National Bureau of Standards (now NIST)) ”国家 标准 化 局 ( 现 是 NIST) 

NCP (Network Control Program) ”网 络 控 制程 序 

NCSC (National Computer Security Center) ”国家 计算 机 安全 中 心 

NFS (Network File System) ”网 络 文件 系统 

NIS (Network Information Services) ”网 络 信息 服务 

NIST (National Institute of Standards and Technology) ”国家 标准 化 与 技术 研究 所 

NORMA (No Remote Memory Access (multiprocessor)) ” 非 远 程 内 存 访问 (多 处 理 器 ) 

NRU (Not Recently Used) ” 非 最 近 使 用 

NSA (National Security Administration) ”国家 安全 局 

NSF (National Science Foundation (USA)) 国家 科学 基金 会 (USA) 

NSP (Name Server Protocol) “名字 服 务 器 协议 

NT (New Technology) ”新 技术 

NTFS (NT File System) ”NT 文件 系统 

NTP (Network Time Protocol) 网 络 时 间 协 议 

NUMA (Non-Uniform Memory Access (multiprocessor)) 非 一 致 内 存 访 问 (多 处 理 器 ) 

OEM (Original Equipment Manufacturers) ”原始 设备 制造 厂家 

OMG (Object Management Group) “对 象 管理 组 织 

ONC (Open Network Computing (form Sun)) ”开放 式 网 络 计算 GEA SUN) 

ORG (Object Request Broker) ”对 象 请 求 代理 

OSF (Open Software Foundation) ”开放 软件 基金 会 

OU (Organizational Units (Windows 2000)) ”组 织 单元 (Windows 2000) 

PAID (Prevent, Avoid, Ignore or Detect (methods for handling deadlocks)) 防止， 避免， 忽略 或 
检测 〈 处 理 死 锁 的 方法 ) 

PDO (Physical Device Objects (Windows 2000)) ”物理 设备 对 象 【Windows 2000) 

POA (Portable Object Adapter (CORBA)) 灵活 对 象 适配器 (CORBA) 

PRAM (Pipelined Random Access Memory (a consistency model)) ”管道 随机 存 取 内 存 (一 种 一 
致 性 模型 ) 

PSTN (Public-Switched Telephone Network) ”公共 开关 电话 网 络 

RAM (Random Access Memory) ”随机 存 取 内 存 

RCP (Remote CoPy) ”远程 复制 

RDN (Relative Distinguished Name (X.500)) ”相关 识别 名 (X.500) 

RFC (Request for Comments) ”请 求 注释 

ROT (Running Object Table (DCOM)) ”运行 对 象 表 (DCOM) 

RPC (Remote Procedure Call) ”远程 过 程 调用 
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RSA (Rivest, Shamir, and Adleman (their public-key encryption algorithm) ) Rivest, Shamir 和 
Adleman 三 种 公 钥 吉 密 算法 

SCSI (Small Computer Systems Interface) ”小 型 计算 机 系统 接口 

SDDL (Security Descriptor Definition Language (Windows 2000)) ”安全 性 描述 定义 语言 (Win- 
dows 2000) 

SDK (Software Developer’ s Kit (Windows 2000)) ”软件 开发 者 工具 包 (Windows 2000) 

SIGOPS (Special Interest Group in Operating Systems (ACM)) (ACM) 操作 系统 专业 组 

SIMD (Single Instruction Stream, Multiple Data Stream) ” 单 指令 流 ,多 数据 流 

SISD (Single Instruction Stream, Multiple Data Stream) ” 单 指 令 流 ,单数 据 流 

SMTP (Simple Mail Transfer Protocol) ”简单 邮件 传输 协议 

SNMP (Simple Network Management Protocol) ”简单 网 络 管理 协议 

SNTP (Simple Network Time Protocol) ”简单 网 络 时 间 协 议 

SOP (Subject-Oriented Progremming) ”面向 主题 程序 设计 

SSL (Secure Socket Layer) ”安全 套 接 字 层 

SSPI (Security Support Provider Interface (Windows 2000)) ”安全 性 支持 提供 者 接口 (Windows 
2000) 

TCP (Transmission Control Protocol) ”传输 控制 协议 

TIG (Task Interaction Graph) 任务 交互 图 

TI-RPC (Transport-Independent Remote Procedure Call) ”独立 传输 远程 过 程 调用 

TNI (Trusted Network Interpretation) ”可 用 网 络 说 明 

UDF (Universal Disk Format) ”通用 磁盘 格式 

UDP (User Datagram Protocol) “用户 数据 报 协 议 

UMA (Uniform Memory Access (multiprocessor)) ”一 致 性 (标准) 内 存 访问 (多 处 理 器 ) 

USN (Update Sequence Number (Windows 2000) ”更 新 序列 号 (Windows 2000) 

URL (Uniform Resource Locator) 一 致 的 资源 定位 器 

UTC (Universal Time Coordinator) ”调整 国际 标准 时 

VLM (Very Large Memory (64-bit address space)) ”超大 型 内 存 (64 位 地 址 空间 ) 

VLSI (Very Large Scale Integration) ”超大 规模 集成 

VRU (Voice Response Unit) ”声音 响应 单元 

WDM (Win32 Device Manager) ”Win32 设备 管理 


KR i R 


access control { 访 问 控制 ) ”防止 对 计算 机 资源 与 文件 进行 未 授权 访问 与 损害 。 

access list 【访问 控制 表 )} ”这 是 一 种 访问 控制 的 方式 ， 每 个 文件 或 资源 都 维护 一 个 列表 ， 
其 中 记录 了 人 允许 访问 此 资源 的 对 象 以 及 允许 访问 的 种 类 。 

access matrix (访问 矩阵 } ”用 来 保存 系统 访问 控制 表 信息 的 二 维 数组 。 

ACID Property (ACID 特性 ) ”事务 的 特 人 性， 从 观察 的 角度 看 ， 保 证 了 事务 的 正确 处 理 。 
ACID 特性 包括 原子 性 、 一 致 性 、 独 立 性 和 持久 性 ， 最 早 在 [HaRe83] 中 提 到 。 

acquire access (获得 访问 权 ) ”释放 一 致 性 中 所 使 用 的 同步 原 语 ， 执 行 读 操作 时 强制 本 地 
系统 更 新 共享 数据 的 副本 。 

acyclic directory structure ( 非 循 环 目录 结构 ) ”一 种 目录 结构 ， 其 中 一 个 文件 或 目录 不 可 以 
有 多 个 父 文件 或 目录 ， 这 样 在 结构 中 就 不 可 能 存在 环 路 。 | 

adaptive scheduler ( 自 适 应 调度 ) 进程 在 一 个 特定 的 位 置 开始 执行 后 ， 因 为 要 适应 系统 的 
一 些 要 求 ， 允 许 对 它 进 行 重新 调度 的 调度 规则 。 所 以 ， 这 样 的 调度 也 允许 进程 在 执行 中 
的 任何 时 刻 进行 迁移 。 

address space (地 址 空间 ) ”整个 系统 内 存 的 一 部 分 ， 用 来 分 配给 特别 的 进程 。 

application layer (MAAR) ”ISO/0SI 参考 模型 中 的 第 七 层 。 这 一 层 不 仅 关注 用 户 接口 ， 并 
且 关 注 建立 基于 网 络 详 用 的 权限 与 可 用 性 ， 

assignment graph {分 配 图 ) 用 来 表示 分 布 式 调度 中 可 能 进程 分 配 情况 的 图 。 

asymmetric encryption { 非 对 称 加 密 ) 含 两 个 密 钥 的 加 密 。 一 个 密 钥 对 明文 进行 加 密 ， 
另 一 个 密 钥 用 来 对 密 文 进行 解密 。 

asynchronous (异步 ) ”不 在 定时 间隔 发 生 的 事件 ， 通 常 由 外 部 来 源 产生 。 

asynchronous primitive (异步 原 语 ) ”参见 非 同 步 原 语 。 

atomic action (原子 操作 ) ”一 系列 不 可 见 的 操作 ， 看 上 去 好 像 是 单个 操作 。 

atomicity property (原子 属性 ) ”事务 的 特性 ， 要 求 事务 中 所 有 的 操作 在 分 布 式 系统 中 都 表 
现 为 单个 操作 。 

authentication (认证 ) ”检验 身份 的 动作 。 

automaton vector (自动 机 向 量 ) ”表示 分 布 式 系统 的 多 种 综合 负载 状态 的 向 量 。 这 个 向 量 
用 做 分 布 式 调度 的 随机 学 习 。 

backbone (主干 网 ) ”将 多 个 网 络 连接 在 -- 起 的 网 络 。 一 般 来 说 ， 在 主干 网 上 的 “ 结 点 ” 
仅 为 其 他 的 网 络 。 

barrier (栅栏 ) ”用 做 司 步 以 提供 释放 一 致 性 。 这 用 以 区 别 执 行 的 不 同 阶段 。 

bastion host (设防 主机 ) ”向 Internet 开放 的 暴露 网 关机 器 。 它 是 外 界 接 触 的 主要 结 点 ， 也 
是 系统 最 容易 遭受 攻击 的 位 置 。 它 是 由 加 强 装 备 的 中 世纪 城堡 外 墙 命名 的 。 

block caching (HAER) ”以 块 为 单位 远程 复制 文件 部 分 。 

blocking primitive (FRZERIR) ”一 种 消息 传递 原 语 ， 在 原 语 结 束 操作 之 前 ， 内 核 不 会 将 控 
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制 权 返回 给 进程 。 这 也 称 为 同步 原 语 ， 因 为 它 导致 通信 的 进程 相互 同步 。 

bridge (网 桥 ) ”连接 多 个 实现 相同 网 络 协 议 的 网 络 的 设备 。 只 有 需要 通过 特定 网 络 的 数据 
包 才 会 转发 到 这 个 网 络 上 。 

bus-contention (总 线 争 用 ) ”因为 多 个 处 理 器 使 用 同一 总 线 访 问 共 享 内 存 中 的 信息 而 导致 
总 线 的 过 度 使 用 ， 从 而 引起 系统 的 效率 和 效果 降低 。 

busy wait (CE) ”由 进程 ( 自 旋 ) 执行 的 连续 循环 ， 等 待 变量 值 (ERM) 的 改变 。 

capability (权能 ) ”资源 复合 法 用 户 对 资源 的 一 种 表示 ， 代 表 了 上 述 使 用 权 的 权限 。 

casual consistency model (偶然 一 致 性 模型 ) ”一 致 性 模型 之 一 ， 要 求 所 有 的 偶然 相关 事件 
对 分 布 式 操 作 系统 中 所 在 成 员 看 来 都 是 相同 顺序 的 。 

casual related event (偶然 相关 事件 ) ”修改 同一 集合 共享 数据 的 事件 。 

certificate authority (认证 部 门 ) ”负责 发 放 和 检验 数字 证 书 的 部 门 ， 相 当 于 电子 化 的 管理 护 
照 的 美国 护照 处 或 者 管理 驾照 的 州 汽车 局 。 

certificate list (认证 证 书 列 污 ) ”提供 认证 的 一 种 方法 。 列 表 包 含 了 不 同 用 户 的 证 书 。 服 务 
必须 核对 此 列表 以 检验 公 钥 。 

child process allowance !( 子 进程 执行 准许 ) “处理 孤儿 进程 的 一 种 方法 ， 其 中 子 进程 必须 不 
断 请 求 继续 准许 执行 。 如 果 父 进程 死亡 了 ， 它 就 不 会 再 分 发 时 间 人 允许 ， 这 样子 进程 就 会 终 
止 执行 。 

ciphertext ( 密 文 ) ”加 密 或 掩饰 后 的 明文 。 

change joumal (修改 日 志 ) 记录 并 跟踪 对 文件 和 目录 内 容 修改 的 方法 。 

class (类 ) ”对 象 的 抽象 定义 。 

clock skew (时 钟 偏 移 ) ”两 个 时 钟 之 间 因 为 偏 移 而 产生 的 差异 。 

cluster (集群 ) 可 度量 服务 的 一 种 抽象 ， 允 许 有 关 的 位 置 相互 独立 ， 而 且 本 身 可 以 通过 在 
同等 或 多 个 物理 服务 器 上 执行 所 需要 的 服务 来 提供 宛 余 和 容错 。 

communication deadlock (通信 死 锁 ) 包含 通信 缓存 的 死 锁 。 

compound transaction ( 复 台 事务 ) ”包含 一 个 以 上 子 事务 的 事务 。 子 事务 必须 组 织 为 层次 
结构 。 复 合 事务 和 所 有 车 套 的 子 事 务必 须 各 自 及 共同 支持 ACD 特性 。 

computationally secure (计算 安全 ) ”使 用 利用 不 可 用 资源 进行 的 系统 分 析 进 行 破解 的 算法 
对 消息 进行 加 密 。 

concurrent-copy (并 发 复制 ) ”内 存 迁 移 的 一 种 方法 ， 复制 整 个 虚拟 内 存 以 及 其 它 有 关 迁 移 
进程 的 信息 ， 同 时 在 原来 的 位 置 并 发 执行 这 个 进程 。 

condition variable (Ail) ”监视 器 中 的 全 局 变量 ， 用 来 控制 管 程 中 要 激活 的 进程 ， 并 
确保 只 有 这 个 进程 才 是 活动 的 。 

consistency (一 致 性 ) ”试图 维护 数据 多 个 副本 的 进程 ， 这 些 数据 在 多 个 位 置 被 操作 ， 每 个 
位 置 都 有 可 接受 的 数据 副本 。 

consistency model (一 致 性 模型 ) “分布 式 系统 中 所 有 的 成 员 ， 包 括 用 户 应 用 程序 都 要 遵循 
的 一 组 定义 好 的 一 致 性 规则 。 

consistency property (一 致 性 属性 ) ”事务 的 特性 ， 要 求 根据 系统 定义 的 一 致 性 模型 ， 所 有 
事务 都 要 在 一 致 的 状态 下 离开 系统 。 

constructor (构造 器 ) ”在 基于 对 象 的 开发 中 ， 如 果 方 法 有 多 个 实例 ， 那 么 其 中 一 个 就 称 为 
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构造 器 。 实 例 不 必 为 独一无二 的 。 即 允许 所 谓 的 方法 过 载 。 

copy-on-reference (引用 时 复制 ) ”内 存 迁 移 钓 一 种 方法 ， 仅 在 迁移 目的 地 引用 到 迁移 进程 
虚拟 内 存 的 页 面 时 复 扰 这 些 页 面 的 副本 。 

copy set (复制 集 ) ”用 在 分 布 式 共 享 数 据 内 存 管理 的 方法 中 ， 维 护 一 个 系统 中 所 有 参与 人 
员 的 列表 ， 其 中 记录 了 谁 持 有 数据 的 特定 块 的 副本 。 

critical region (临界 区 ) ”访问 共享 资源 的 程序 部 分 。 

cryptography (密码 学 ) ”产生 安全 密 文 的 学 问 。 

cutest (IH) ” 边 的 集合 ， 如 果 去 掉 了 这 些 边 ， 连 通 图 将 成 为 不 连通 图 ， 即 有 两 个 或 更 多 
不 能 通过 边 连接 的 组 件 。 

cyclic directory structure (循环 目录 结构 ) ”一 种 目录 结构 ， 其 中 一 个 文件 或 目录 可 以 有 多 
个 父 文 件 或 父 目 录 ， 这 样 在 结构 中 就 可 能 存在 环 路 。 而 且 ， 子 文件 或 目录 可 以 成 为 其 父 文 
件 或 目录 之 一 的 父 文 件 或 目录 ， 这 样 就 产生 了 循环 结构 。 

data link layer (数据 链 路 层 ) ”1ISO/OSI 参考 模型 中 的 第 二 层 。 这 一 层 可 以 分 为 两 个 子 层 : 

”媒体 访问 控制 和 钦 辑 链 路 控制 。 

deadiock ( 死 锁 ) ”资源 分 配 的 问题 ， 导 致 分 配方 案 禁 止 两 个 或 更 多 的 进程 取得 进展 。 

decryption (AE) ”将 合适 的 算法 和 合适 的 密 钥 作用 在 信息 上 ， 使 其 可 读 。 

digest function (摘要 函数 ) ”函数 的 输入 是 文档 ， 输 出 是 一 个 惟一 值 ， 用 做 数字 签名 。 这 
LE PR A tH BK A BO BRR o 

digital certificate (数字 证 书 ) ”一 种 电子 的 、 可 验证 的 标识 项 ， 相 当 于 电子 的 护照 或 者 轰 

digital signature (数字 签名 ) ”在 分 布 式 环境 中 确保 初始 标识 或 者 内 容 完整 性 的 技术 。 

directory service (目录 服务 ) ”部 分 分 布 式 文件 系统 提供 文件 系统 的 用 户 和 界面 ， 并 对 系统 的 
总 体 结构 负责 。 

direct store-and-forward deadlock (直接 存储 转发 死 锁 ) ”正好 涉及 两 个 位 置 的 通信 死 锁 。 

dispersion (散布 值 ) ” 指 本 地 时 钟 相对 于 NTP 一 级 参考 时 钟 允 许 的 最 大 错误 值 。 散 布 值 越 
高 ， 表 示 时 钟 信息 越 不 可 靠 。 

distributed system (分 布 式 系统 ) ”通过 网 络 连接 的 多 个 异 质 系统 统一 表现 为 一 个 系统 及 其 

divisible process (可 分 割 进程 ) ”可 以 根据 进程 特性 分 割 为 更 小 子 进程 或 者 任务 的 进程 。 这 
些 任务 可 以 独立 调度 。 

domino effect (多 米 诺 效应 ) ”事务 中 止 时 如 果 有 其 他 事务 错误 地 依赖 于 中 止 事 务 而 产生 的 
结果 。 这 种 情况 下 ， 所 有 其 他 事务 以 及 依赖 于 这 些 事务 的 事务 都 要 中 止 。 

drifting ( 偏 移 ) ”一 度 同 步 的 时 钟 发 生 的 逐渐 偏差 。 

dual-homed host (双重 位 置 主机 ) ”连接 到 你 少 两 个 网 络 上 的 计算 机 系统 。 

durability property (持久 性 属性 ) ”事务 的 特性 ， 要 求 已 经 提交 的 服务 器 即使 发 生 了 系统 错 
误 也 要 完成 事务 。 事 和 的 所 有 结果 都 必须 是 永久 的 。 

dynamic binding (动态 绑 定 ) ” 当 进 程 的 可 执行 影像 被 创建 时 并 不 绑 定 在 特定 位 置 上 执行 。 

economic usage point ( 径 济 使 用 点 数 ) ”分 布 式 调 度 中 使 用 点 数 方法 的 一 个 变种 ， 其 中 点 
数 表示 基于 系统 负载 和 其 他 特性 的 远程 执行 价值 。 
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embedded real-time system (RRAKRHAA) ”安装 在 更 大 系统 中 的 实时 系统 ， 用 于 控制 
特别 的 硬件 。 

encryption (WE) ”将 合适 的 算法 和 合适 的 密 钥 作用 在 信息 上 ， 使 其 不 可 读 。 

entry release consistency (人 入口 释 放 一 致 性 ) ”基于 释放 一 致 性 的 一 致 性 模型 ， 同 样 要 求 所 
有 的 变量 均 为 同步 变量 ， 或 者 与 同步 机 制 结合 ， 如 锁 或 者 栅栏 。 

executive (执行 程序 ) ”在 Windows NT 内 核 中 实现 系统 服务 。 

external fragmentation (外 部 碎片 ) ”物理 内 存 中 在 多 个 内 存单 位 〈 如 段 ) 之 间 所 浪费 的 内 
存 空 间 。 

explicit addressing (ERIH) ”消息 传递 的 寻 址 机 制 ， 其 中 调用 进程 指定 要 通信 的 确切 进 
程 。 

false sharing (错误 共享 ) ”在 分 布 式 系统 中 的 多 个 位 置 ， 当 一 个 页 面 发 生 颠 撕 ,但 是 没有 
共享 这 个 页 面 上 的 任何 数据 结构 时 这 种 情况 就 会 发 生 。 

file access semantic (文件 访问 语义 ) ” 当 共 享 文件 发 生 修改 时 ， 对 分 布 式 系 统 中 成 员 进 行 
通知 的 一 种 方法 。 

file handie (文件 句柄 ) ”给 文件 用 户 的 信息 ， 有 文件 的 位 置 ， 还 可 能 还 包括 访问 上 述 文件 
的 权限 。 

file service (文件 服务 ) 分布 式 文件 系统 的 一 部 分 ， 负 责 操 作 特 定 的 文件 。 

file system (文件 系统 ) ”操作 系统 的 一 个 重要 的 子 系 统 ， 负 责 维护 目录 、 文 件 以 及 管理 命 
名 空间 。 

firewall {防火墙 ) ”被 设计 以 防 内 部 计算 机 资源 受到 外 部 的 威胁 ， 提 供 访 问 控 制 。 

firm-real-time system (稳固 实时 系统 ) ”能 容忍 小 概率 的 系统 故障 的 实时 系统 。- 

flow control ( 流 控制 ) ”这 个 术语 用 来 形容 网 络 的 功能 ， 它 规定 了 所 传输 数据 的 数量 和 传输 
的 频率 ， 以 防止 “压倒 ”网 络 资源 。 

freeze time (冻结 时 间 ) ”在 进程 迁移 过 程 中 ， 进 程 停 止 和 重启 动 之 间 所 浪费 的 执行 时 间 。 

function overloading (功能 过 载 ) ”如果 允 许 对 一 个 功能 进行 多 重 定义 ， 所 有 的 这 些 功能 使 
用 完全 相同 的 名 称 ， 但 是 它们 的 参数 列表 和 行为 不 同 。 

gang scheduling (集体 调度 ) ”调度 的 策略 ， 人 允许 所 有 相关 的 进程 /线程 同时 调度 。 

global naming (全 局 命名 ) ”在 分 布 式 系统 中 ， 每 个 文件 或 者 对 象 都 有 独一无二 的 名 称 的 系 
统 。 全 局 命名 不 提供 命名 透明 。 

global scheduler (全 局 调度 ) ”调度 负责 在 分 布 式 系统 中 为 处 理 器 分 配 进程 。 

global order (全 局 顺序 ) ”可 以 在 分 布 式 系统 中 惟一 地 标识 所 有 事件 顺序 的 概念 。 

global time (全 局 时 间 ) ”让 分 布 式 系统 中 所 有 对 钟 都 同步 的 概念 。 

happen-before relationship (超前 关系 ) ”分 布 式 环境 中 用 来 获得 相对 偏 序 次 序 的 关系 。 它 
用 来 标识 偶然 关系 ， 首 先 由 Lamport [Lam78] 提出 。 

hard real-time system ( 硬 实时 系统 ) ”必须 满足 限定 的 边界 响应 时 间 约 柬 或 者 能 够 经 受 严 
重 的 ， 可 能 是 有 生命 威胁 后 果 的 系统 。 

hash function ( 散 列 函数 ) ”参见 摘要 函数 。 

heuristic (启发 规则 ) ” 一般 能 够 达到 所 需 结果 的 规则 。 这 些 规则 无 需 提供 的 或 者 可 以 直接 
计量 的 ， 但 是 总 能 够 以 有 效 的 方式 达到 满意 的 结果 。 
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hierarchical directory structure (层次 目录 结构 ) ”一 种 类 似 树 的 目录 结构 ， 其 中 给 定 的 文件 
或 者 目录 只 能 够 有 一 个 父 级 。 

host (主机 ) ”连接 到 网 络 上 的 任何 计算 机 系统 。 

immediate notification (立即 通知 ) ”修改 通知 的 一 种 方法 ， 其 中 每 次 对 文件 的 修改 都 要 立即 
通知 分 布 式 系 统 的 参与 人 员 。 

immutable file (不 可 更 改 文件 ) ”内 容 不 能 修改 的 文件 ， 即 不 允许 修改 。 

implicit addressing ( 隐 式 寻 址 ) ”消息 传递 的 寻 址 机 制 ， 其 中 调用 进程 指定 要 通信 的 服务 ， 
代替 显 式 指定 进程 的 名 称 。 

incidental ordering (随机 排序 ) ”多 对 多 消息 排序 的 一 种 形式 ， 仅 要 求 随机 相关 的 消息 以 正 
确 的 顺序 接收 。 

indirect store-and-forward deadlock ( 非 直 接 存储 转发 死 锁 ) 包含 两 个 以 上 位 置 的 通信 死 
锁 。 

indivisible process (不 可 分 进程 ) ”不 能 再 进一步 分 解 成 子 进程 或 者 任务 的 进程 ， 必 须 在 单 
个 处 理 器 上 运行 。 

inheritance (继承 ) ”人 允许 一 个 对 象 按照 其 他 对 象 的 形式 定义 自身 。 

intemal fragmentation (内 部 碎片 ) ”内 存 中 的 块 所 浪费 的 内 存 。 

interprocess communication (进程 间 通 信 ) ”两 个 或 更 多 的 进程 为 了 达到 共同 的 目标 进行 通 
信和 的 一 种 方法 。 

interrupt (FR) ”进程 向 操作 系统 发 出 信和 号， 要 求 某 种 服务 的 一 种 方法 。 

isochronous (等 时 ) ”异步 事件 的 一 个 子 类 ， 事 件 可 以 不 在 精确 的 时 间 间 隔 处 发 生 ， 这 样 的 
话 它 们 就 应 归 为 同步 事件 了 ， 但 是 发 生 在 一 个 给 定 的 时 间 范 围 内 ， 可 以 因为 网 络 延 迟 等 原 
因而 稍 有 偏差 。 

isolation property (独立 特性 ) ”事务 的 特性 ， 要 求 事务 以 “所 有 或 无 ”的 方式 来 运行 ， 其 
他 的 成 员 不 能 访问 中 间 结 果 。 

ISO/OSI reference model (ISO/OSI 参考 模型 ) ”比较 了 不 同 的 分 布 式 /网 络 环境 ， 作 为 基本 
系统 的 标准 而 建立 的 七 层 参 考 模型 。 

job (作业 ) ”执行 中 的 尝 序 。 这 个 术语 通常 指 进 程 的 系统 视角 。 

kemel (内 核 ) ”操作 系统 中 的 特权 部 分 ， 对 于 所 有 的 资源 都 有 完全 的 访问 权限 。 

lazy release consistency ( 懒 释放 一 致 性 ) ” 仅 在 需要 时 才 执 行 写 或 更 新 操作 的 释放 一 致 性 。 

leap second ( 跳 秒 ) ”为 了 确保 UTC 时 间 ， 一 种 基于 原子 的 时 间 ， 与 天 文 时 间 保 持 一 致 ， 
有 时 需要 在 某 一 分 钟 内 增加 或 者 减少 一 秒 。 

load balancing (负载 平 街 ) ”一 种 负载 分 配 策略 ， 尽 量 通过 迁移 保持 系统 内 公平 的 负载 。 

load sharing (负载 共享 ) ”一 种 负载 分 配 策略 ， 通 过 迁移 协助 工作 过 度 的 资源 。 

local scheduler (本 地 调度 ) ”负责 调度 进程 到 特定 位 置 的 实际 CPU 的 调度 程序 。 本 地 调度 
进程 负责 在 一 个 地 方 进行 调度 ， 而 不 涉及 在 远程 位 置 的 调度 中 。 

location resolution (位 置 解 析 ) ”从 全 局 文件 名 称 到 文件 位 置 的 映射 。 

logical clock (逻辑 时 钟 ) ”用 来 决定 事件 的 相对 次 序 的 时 钟 。 逻 辑 时 钟 不 关心 “人 类 ”的 
时 间 。 

logical link control (逻辑 链 路 控制 ) ”ISO/OSI 参考 模型 中 数据 链 路 层 的 子 层 。 主 要 的 功能 包 
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括 错误 控制 和 流 控 制 。 

lost update (遗失 更 新 ) ”如 果 没 有 自动 地 处 理事 务 ， 可 能 在 共享 数据 中 发 生 的 潜在 问题 。 
它 包括 多 个 事务 全 都 复制 同一 个 共享 数据 来 改变 它 的 值 。 当 结果 返回 时 ， 每 个 返回 值 都 覆 
盖 了 它 的 前 一 个 事务 的 结果 。 这 样 ， 前 一 事务 的 结果 就 完全 丢失 了 。 

mandatory scheduler (强制 性 调度 ) ”要 求 分 布 式 系 统 中 的 每 个 位 图 都 参与 分 布 式 调度 的 分 
布 式 调度 程序 ， 允 许 远 程 进程 在 本 地 执行 。 

marshalling (整理 ) ”在 远程 过 程 调用 中 所 执行 的 函数 名 称 ， 把 数据 整理 为 在 网 络 上 快速 通 
信 的 格式 。 

maximum flow of a graph (最 大 流 图 ) ”图 包含 最 大 权 值 的 边 的 子 图 。 

medium access control (媒体 访问 控制 ) ISO/OSI 参考 模型 中 数据 链 路 层 的 子 层 。 这 个 以 局 
域 网 为 中 心 的 子 层 主要 关心 共享 广播 网 络 的 合理 使 用 。 

memory management unit (内存 管 理 单元 ) ”虚拟 内 存 管理 器 ， 将 虚拟 内 存 映 射 为 物理 内 存 
和 磁盘。 

message digest (消息 摘要 ) ”对 文档 使 用 摘要 函数 的 结果 。 这 个 摘要 可 以 用 来 验证 文档 的 
内 容 是 否 被 修改 。 

message passing (消息 传递 ) 进程 间 通 信和 的 一 种 方式 ， 人 允许 两 个 可 能 位 于 不 同 的 机 器 上 
进程 通过 传递 拥有 共享 数据 的 消息 进行 通信 。 

midware (FEH) ”运行 在 本 地 或 者 基本 中 心 操作 系统 之 上 的 分 布 式 操 作 系统 。 

migration (迁移 ) ”在 另 一 个 可 能 位 于 远程 位 置 处 理 器 上 重新 载 人 进程 以 及 所 有 有 关 的 信息 
的 动作 。 

min-cut (hkk) ”图 的 最 小 割 集 ， 即 带 有 最 小 代价 的 割 集 。 割 集 的 代价 是 由 割 边 权 值 
的 总 和 决定 的 。 

modification notification (修改 通知 ) ”用 来 通知 分 布 式 系统 的 成 员 分 布 式 系统 中 的 文件 已 经 
被 修改 。 

moniker (标记 ) ”DCOM 中 的 对 象 实例 ， 标 记 的 接口 是 Inoniker。 

monitor ( 管 程 ) ”使 编译 器 支持 互 斥 的 语言 构造 。 管 程 是 一 种 抽象 的 数据 类 型 ， 包 括 变量 、 
过 程 和 数据 结构 。 

multicast (组 播 ) ”向 所 有 连接 到 网 络 的 用 户 中 的 一 个 子 集 发 送信 息 。 

multicomputer (多 计算 机 ) ”每 个 处 理 器 都 有 自己 的 本 地 内 存 的 并 行 计算 机 。 

multiple inheritance (多 重 继承 ) ”允许 一 个 对 象 按照 其 他 多 个 已 存在 对 象 的 形式 定义 自身 。 

multi-threaded (多 线程 ) ”允许 进程 并 发 执行 多 个 计算 线程 的 环境 。 

multi-processor (多 处 理 器 机 ) ”所 有 处 理 器 共享 同一 内 存 的 并 行 计算 机 。 

mutual exclusion (BFE) ”保证 多 个 进程 不 能 间 时 使 用 共享 资源 。 

named pipes (命名 管道 ) ”使 用 相关 进程 的 进程 间 通 信 形 式 。 

name resolution (REH) 从 人 类 (基于 字符 的 ) 文件 名 称 到 全 局 (二进制 ) 名 称 的 映 
射 。 

name service (名 字 服 务 ) ”文件 系统 的 一 部 分 ， 负责 将 文件 名 映射 到 文件 位 置 。 在 分 布 式 
环境 中 ， 它 可 能 还 要 负责 将 本 地 名 字 映 射 为 全 局 名 字 ， 以 及 将 计算 机 生成 的 名 字 映 射 为 
对 人 类 友好 的 名 字 。 
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Name space (名 字 空 间 ) “系统 中 文件 、 目 录 和 组 件 可 使 用 的 名 称 的 完整 集合 。 因 为 给 定 
系统 的 名 字 服 务实 现 的 名 字 规 则 的 缘故 ， 这 个 集合 经 常 是 有 限 的 。 

nested transaction (REBSS) BATHS, 

network layer (WAR) ISO/OSI 参考 模型 中 的 第 三 层 ， 它 负责 路 由 。 对 局 域 网 来 说 ， 这 层 
是 空 的 。 

network system (网 络 系统 ) ”连接 到 网 络 上 的 异 质 计 算 机 的 集合 。 系 统 之 间 的 异 质 是 公开 
的 ， 对 于 参与 人 员 的 计算 机 有 很 少 的 限制 。 

non-blocking primitive ( 韭 阻 塞 原 语 ) ”一 种 消息 传递 原 语 ， 其 中 内 核 马 上 将 控制 权 返 回 给 进 
程 ， 而 并 不 等 待 到 原 语 结束 。 它 也 被 称 为 异步 原 语 。 

nonce (临时 标签 ) ”用 并 认证 问题 中 的 随机 整数 值 。 如 果 接 收 到 ， 则 返回 申请 人 的 消息 中 
必须 包含 正确 的 临时 标签 值 。 

non-repudiation ( 非 拒 认 ) ”保证 成 员 不 能 否认 其 签名 以 及 签名 后 的 数字 信息 。 

NORMA multiprocessor (NORMA 多 处 理 器 ) “多 处 理 器 ， 其 中 每 个 处 理 器 都 有 各 自 的 本 地 
内 存 ， 处 理 器 之 间 不 能 共享 内 存 。 

notification on close (关闭 时 通知 ) ”修改 通知 的 一 个 类 型 ， 当 分 布 式 系统 的 参与 人 员 关 闭 
了 它们 修改 的 文件 时 ， 其 他 的 成 员 才 会 被 通知 。 

notification on transaction completion (事务 完成 时 通知 ) ”修改 通知 的 一 个 类 型 ， 系 统 使 用 
了 事务 ， 并 且 分 布 式 系 统 的 成 员 只 有 在 成 员 完成 了 事务 以 后 才 会 被 通知 。 

NP -Hard (NP- 困 难 ) ”非常 难以 计算 的 问题 ， 还 没有 已 知 存在 的 多 项 式 时 间 算 法 的 解决 方 
案 。 

NUMA multiprocessor (NUMA 多 处 理 器 ) ” 带 有 共享 内 存 的 多 处 理 器 ， 访 问 共享 内 存 的 时 间 
因为 它 与 处 理 器 子 群 的 关系 而 有 所 不 同 。 

object (对 象 ) ”封装 了 所 有 与 服务 与 数据 相关 的 开发 抽象 。 

object-based system (基于 对 象 的 系统 ) ”使 用 对 象 设计 与 定义 的 系统 。 

object behavior (对 象 行为 ) ”由 特定 对 象 所 能 够 执行 的 函数 的 完整 集合 定义 。 

object-oriented system (面向 对 象 系统 ) ”使 用 对 象 设计 与 定义 ， 并 允许 对 象 继承 的 系统 。 

one-time assignment scheduler (一 次 分 配 调度 ) ”在 进程 已 经 被 设计 到 某 特定 位 置 执行 后 ， 
不 允许 涉及 或 迁移 进程 的 调度 程序 。 

optimal scheduling algorithm (最 优 调度 算法 ) ”按照 某 种 标准 ， 有 可 能 确定 最 好 可 能 的 解决 
方法 的 调度 算法 。 

orphan clean up (孤儿 清除 ) ”处 理 孤 儿 进 程 的 一 种 方法 ， 当 系统 重启 动 时 ， 死 去 父 进程 的 
系统 终止 孤儿 进程 。 

orphan process (孤儿 进程 ) ”一 个 进程 在 分 布 式 系统 中 远程 执行 ， 而 它 的 父 进 程 已 经 过 早 
死亡 了 ， 可 能 是 因为 系统 的 崩 演 。 

packet (€) ”因特网 上 通信 的 主要 单位 。 消 息 要 分 解 成 为 包 。 

packet-filtering gateway ( 包 过 滤 网 关 ) ”有 选择 地 控制 或 者 “过 滤 ” 进 入 或 离开 内 部 网 络 的 
数据 的 防火 墙 。 它 试图 保护 网 络 免 遭 攻击 。 

page (页 面 ) ”将 内 存 块 分 割 成 大 小 相同 的 块 的 概念 。 分 页 系统 可 能 会 有 内 部 碎片 ， 但 不 
会 有 外 部 碎片 。 
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page fault (页 面 错误 ) ” 当 一 个 进程 要 求 一 个 不 在 物理 内 存 中 的 内 存 的 页 面 时 就 会 发 生 页 
面 错误 。 页 面 错误 将 导致 系统 从 磁盘 或 者 另 一 台 通 过 网 络 连接 到 分 布 式 系统 中 的 主机 上 
取 回 页 面 。 

page scanner (RMA) 系统 的 端口 监控 程序 ， 用 在 共享 内 存 模型 中 监视 内 存 中 的 页 
面 被 非 本 地 访问 的 频率 。 

parallel system (并 行 系统 ) ” 蜡 质 的 处 理 器 和 内 存 模块 存在 于 单独 的 计算 机 之 内 。 

peer-to-peer layer (对 等 层 ) ”这 些 ISO/0SI 参考 模型 层次 的 功能 只 在 源 位 置 和 目标 位 置 执 
行 。 

pipe (WË) “” 当 进程 至 少 共 享 同一 个 文件 系统 时 ， 使 用 进程 间 通 信 的 一 种 形式 。 

physical clock (物理 时 钟 ) ”用 来 报告 并 维护 “人 类 ”时 间 的 时 钟 ， 与 物理 时 钟 相对 应 。 

physical layer (物理 层 ) ”1SO/0SI 参考 七 层 模型 的 最 低层 。 这 一 层 涉及 诸如 如 何 将 位 放 到 
网 络 上 以 及 决定 连接 物理 接口 的 问题 。 

plaintext (RASC) ” 想 要 隐瞒 的 信息 。 

plug and play (MERA) ”要 求 硬件 和 软件 支 尘 并 允许 连接 到 系统 的 计算 机 设备 不 需要 用 
户 的 干涉 和 配置 就 能 改变 并 认 出 。 

point-to-point layer {点 对 点 层 ) ”ISO/OSI 参考 模型 中 这 些 层次 的 功能 不 仅 在 源 位 置 和 目标 
位 置 执行 ， 而 且 在 源 位 置 和 目标 位 置 之 间 上 千 个 可 能 的 网 络 位 置 上 执行 。 

polled-loop scheduler ( 轮 询 调度 ) ”要求 调 度 程 序 先 询问 进程 是 否 需要 系统 服务 的 调度 程 
序 。 这 种 请 求 以 循环 方式 操作 。 

PRAM consistency model (PRAM 一 致 性 模型 ) ”管道 随机 访问 内 存 一 致 性 模型 ， 要 求 一 个 
进程 所 执行 的 所 有 写 操作 要 以 它们 所 操作 的 顺序 在 其 他 的 进程 前 出 现 。 

presentation layer (表示 层 ) ”ISO/OSI 参考 模型 的 第 六 层 。 这 一 层 处 理 信息 的 语法 ， 包 括 
ASCII 到 EBCIDIC 的 转换 、 压 缩 、 加 密 等 。 

private key cryptography ( 私 钥 加 密 ) ”加 密 和 解密 使 用 一 个 密 钥 ， 它 必须 被 秘密 保存 。 

process (进程 ) ”执行 中 程序 的 抽象 。 

process migration (进程 迁移 ) ”将 一 个 进程 以 及 所 有 相关 的 状态 信息 重新 装 入 到 另 一 个 处 
理 器 上 ， 可 能 位 于 远程 位 置 上 。 

process version number (进程 版 本 号 ) ”处 理 孤 上 儿 进 程 的 一 种 方法 ， 子 进程 总 是 伴随 着 一 个 
版 本 号 。 当 父系 统 重 启动 时 ， 它 使 用 一 个 新 的 版 本 号 ， 并 向 分 布 式 系统 的 成 员 通知 这 个 新 
的 版 本 号 。 任 何 执行 过 期 钓 版 本 号 的 进程 将 会 终止 。 

processor consistency modei (处 理 器 一 致 性 模型 ) ”要 求 PRAM 一 致 以 及 内 存 一 致 的 一 致 性 
模型 。 

protected variable (保护 变量 ) ”按照 释放 一 致 性 操作 的 变量 。 

proxy-service firewall (代理 服务 防火 墙 ) ”对 于 使 用 外 部 网 络 的 服务 ， 用 更 加 安全 的 版 本 来 
代替 原 有 的 服务 ; 特别 是 它 对 于 外 部 的 服务 器 来 讲 是 代表 内 部 客户 出 现 的 ， 而 不 是 让 客户 
直接 与 服务 器 接触 。 有 助 于 防止 危害 网 关 的 后 果 。 

public key cryptography (AAWE) ”存在 两 个 密 钥 ， 一 个 公 钥 一 个 私 钥 。 如 果 一 个 密 钥 对 
消息 进行 加 密 ， 那 另 一 个 密 钥 就 可 以 将 其 解密 。 私 钥 必 须 秘 密 保存 。 

race condition (竞争 条 件 ) ”输出 结果 依赖 于 输入 值 到 达 的 确切 时 间 。 
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reactive real-time system (MERIR) ”对 环境 不 断 地 交互 作出 反应 的 实时 系统 。 
real-time system (实时 系统 ) ”必须 满足 边界 响应 时 间 限 制 的 系统 ， 否 则 将 遭受 严重 的 后 果 
(参见 软 实时 与 硬 实时 )。 

release access (释放 访问 权 ) ”释放 一 致 性 中 完成 最 后 一 个 写 操 作 后 所 使 用 的 同步 原 语 。 
它 强 制 向 整个 系统 发 布 共 享 数据 的 改动 。 

release consistency model (释放 一 致 性 模型 ) ”使 用 获得 访问 权 和 释放 访问 权 同 步 原 语 的 一 
致 性 模型 。 

remote access (远程 访问 ) ”一 种 分 布 式 文件 服务 ， 客 户 并 不 在 本 地 传输 文件 ， 而 是 通过 
实际 的 文件 服务 器 进行 所 有 的 文件 访问 。 

remote copy (远程 复制 ) ”一 种 分 布 式 文件 服务 ， 客 户 向 他 们 的 位 置 传输 文件 的 副本 。 
remote procedure calls (RPC) { 远 程 过 程 调用 ) ”进程 间 通 信 的 一 种 方式 ,使 用 相似 过 程 的 
格式 。 这 种 方法 也 允许 被 调用 的 过 程 返回 一 个 值 ， 而 不 仅仅 是 一 个 确认 。 

reparse tag (再 解析 标记 ) ”指示 已 经 到 达 了 青 解析 点 ,并 且 适 用 于 给 定 的 文件 。 

reparse point (再 解析 点 ) ”通过 使 用 文件 名 和 再 解析 标记 中 所 指定 的 过 滤器 ， 让 文件 系统 
过 滤器 改变 文件 处 理 方 式 的 一 种 办 法 。 

retrieval disparity (检索 不 一 致 ) ”如 果 没 有 自动 地 处 理事 务 并 保持 独立 性 ， 可 能 在 共享 数 
据 中 发 生 的 潜在 问题 。 其 中 ， 取 回 的 数据 值 不 能 反映 最 近 事 务 的 结果 。 

repeater (FR) ”连接 两 个 实现 相同 协议 网 络 的 设备 。 一 个 网 络 上 的 每 个 数据 包 都 直接 
转发 到 另 一 个 网 络 。 

request (WR) ”在 基于 对 象 的 开发 中 ， 一 个 对 象 调用 另 一 个 对 象 服务 的 方法 。 

router (路 由 器 ) ”连接 两 个 实现 了 不 同 协议 的 设备 。 

session layer (会 话 层 ) ”1ISO/O0SI 参考 模型 的 第 五 层 ， 负 责 源 位 置 和 目标 位 置 之 间 通信 的 
同步 。 

segment (R) ”一 种 内 存 块 ， 大 小 可 变动 。 段 会 有 外 部 碎片 ， 同 时 也 会 有 少量 的 内 部 碎片 。 
sequential consistency model (顺序 一 致 性 模型 ) ”要 求 所 有 参与 人 员 共 享有 关 事 务 顺 序 相 
同 的 全 局 视图 的 一 致 性 模型 。 

shared memory model (HR AFRE) ”分 布 式 计算 环境 中 内 存 管理 的 模型 ， 进 程 通过 通 
用 数据 结构 进行 通信 。 

simple memory model (简单 内 存 模型 】 #6 UMA 架构 所 使 用 的 内 存 管理 模型 ， 直 接 基 于 
集中 式 系 统 的 内 存 管理 。 

snoopy cache (BERRE) ”一 种 高 速 缓存 一 致 性 模型 ， 其 中 处 理 器 监视 共享 总 线 的 有 
关 修 改 当前 其 本 地 高 速 缓存 副本 的 数据 的 信息 。 

stateful file service (有 状态 文件 服务 ) ”一 种 分 布 式 文件 服务 类 型 ， 其 中 文件 服务 器 维护 所 
有 客户 和 他 们 正在 访问 的 文件 列表 的 状态 信息 ， 还 有 他 们 在 给 定 文件 中 的 位 置 。 

Stateless file service (元 状态 文件 服务 ) ”一 种 分 布 式 文件 服务 类 型 ， 其 中 文件 服务 器 并 不 
维护 任何 客户 的 状态 信息 。 所 有 的 客户 请 求 都 必须 带 有 有 关 它 们 特别 请 求 的 完整 信息 。 
Static binding (静态 绑 定 ) ”创建 进程 的 可 执行 影像 时 ， 进 程 马上 与 执行 的 具体 位 置 进行 绑 定 。 
status state (状态 情况 ) “分布 式 系统 中 表示 一 个 特定 系统 负载 的 值 。 有 些 实现 方式 使 用 了 
两 个 状态 : 欠 载 和 过 载 ， 而 其 他 方式 则 还 使 用 了 合理 负载 作为 第 三 种 状态 。 
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stratum (层次 ) NIP 中 所 使 用 的 术语 ， 指 的 是 客户 或 者 服务 器 在 树 状 体系 结构 中 所 处 的 
等 级 。 

stochastic leaming (随机 学 到 ) ”分 布 式 调度 的 一 种 方法 ， 其 中 算法 从 先前 的 选择 中 得 到 反 
馈 ， 然 后 将 这 个 信息 用 来 促进 以 后 的 选择 。 

strict consistency model (严格 一 致 性 模型 ) ”要 求 所 有 读 操作 从 最 近 的 写 操 作 处 返回 值 的 一 
致 性 模型 。 

structured file (结构 化 文件 ) ”文件 存储 的 一 种 方法 ， 每 个 文件 都 分 解 成 多 个 记录 。 文 件 系 
统 通过 外 部 索引 支持 这 些 记 录 。 

socket (BHF) ”进程 间 通 信 的 一 种 方法 ， 要 求 通信 进程 绑 定 在 公用 的 端点 上 。 

soft real-time system ( 软 实时 系统 ) ”必须 满足 边界 响应 时 间 约 东 的 系统 ， 和 否则 将 遭受 如 性 
能 下 降 的 不 良 后 果 。 

spinlock ( 自 旋 锁 ) ”由 循环 或 自 旋 不 断 检查 的 变量 。 自 旋 锁 常 用 于 忙 等 待 。 

spinning ( 自 旋 ) ” 忙 等 待 中 不 断 检查 变量 的 值 的 篇 环 。 

stop-and-copy (停止 和 复制 ) ”停止 执行 的 内 存 迁 移 的 一 种 方法 ， 将 与 迁移 进程 相关 的 实体 
虚拟 内 存 复制 ， 然 后 在 迁移 目的 地 重新 开始 执行 。 

sub-optimal approximate scheduling algorithm (次 优 近 似 调度 算法 ) 使 用 最 优 方法 的 “ 捷 
径 ” 来 快速 获得 次 优 方 法 的 调度 算法 。 

sub-optimal heuristic scheduling algorithm (次 优 启发 式 调 度 算法 ) ”使 用 基本 直觉 考虑 规则 
的 调度 算法 往往 会 得 到 更 好 的 整体 系统 性 能 。 这 些 规则 不 是 必须 提供 的 或 者 可 以 直接 衡量 
对 系统 性 能 的 作用 的 。 

sub-optimal scheduling algorithm (次 优 调度 算法 ) ”试图 找 出 按照 某 种 标准 来 衡量 的 非常 好 
的 解决 方案 的 调度 算法 ， 但 不 必 是 最 优 解 。 次 优 算法 比 最 优 算法 要 快 得 多 。 

sub-transaction ( 子 事务 ) 庞大、 复合 事 务 的 一 部 分 事务 ， 也 被 称 为 嵌 套 事务 。 

symmetric encryption (对 称 加 密 ) 涉及 单个 密 钥 的 加 密 。 使 用 同一 个 密 铀 对 明文 进行 加 
密 ， 对 密 文 进 行 解 密 。 

synchronization variable (同步 变量 ) ”用 来 同步 内 存 与 维护 弱 一 致 性 。 

synchronous { 同 步 ) ”发 生 于 精确 、 规 则 、 可 预计 时 间 间 隔 的 事件 ， 一 般 从 实时 系统 的 附 
加 组 件 处 产生 。 

synchronous primitive (同步 原 请) ”参见 阻塞 原 语 。 

Task Interaction Graph (任务 交互 图 ) ”图 的 节点 表示 相关 的 进程 ， 而 边 表示 进程 之 间 的 交 
互 。 这 种 图 用 来 表示 可 以 模块 化 划分 的 负载 。 

thrashing (M) ”内 存 管 理 中 的 术语 ， 形 容 系 统 长 期 处 于 取出 并 移 走 内 存 页 面 的 状态 ， 导 
致 了 性 能 的 严重 下 降 。 

thread (线程 ) ”执行 线程 的 简称 ， 表 示 贯 穿 程序 的 一 条 路 径 。 

time provider (时 间 提 供 者 ) ”能 够 直接 从 UTC 服务 器 上 接受 信息 ， 并 作出 适当 调整 以 弥补 
通信 延迟 的 商业 设备 。 

transaction (事务 ) ”共享 数据 上 的 归 为 一 组 的 一 组 操作 ， 作 为 单一 动作 看 待 。 

transaction management (事务 管理 ) ”为 了 确保 事务 的 正确 操作 而 使 用 的 服务 。 

transport layer 【传输 层 ) ”ISO/0SI 参考 模型 的 第 四 层 。 这 一 层 建 立 了 通信 服务 种 类 。 服 务 
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的 种 类 可 以 是 面向 连接 的 或 者 无 连接 的 。 

two-phase commit protocol (两 阶段 提交 协议 ) ”实现 事务 的 一 个 协议 。 这 个 协议 分 成 准备 
提交 阶段 和 提交 阶段 ， 遵 循 事务 的 ACID 属性 。 

unnamed pipe {未 命名 管道 ) ”进程 间 通 信 的 一 种 方式 ， 不 相关 的 进程 共享 一 个 公用 文件 系 
统 时 可 以 使 用 。 

UMA multiprocessor (UMA 多 处 理 器 ) ”一 种 多 处 理 器 ， 其 中 所 有 的 处 理 器 共享 内 存 ， 而 访 
问 任何 内 存 模块 的 访问 时 间 是 均匀 的 〈 相 等 的 )。 

uniform ordering (均匀 排序 ) ”一 种 多 对 多 消息 排序 的 形式 ， 要 求 所 有 的 消息 均匀 地 按照 所 
有 接收 进程 进行 接收 ， 参 与 人 员 接 收 的 顺序 可 以 与 发 送 的 顺序 不 同 。 

universal number (统一 号 ) ”不 依赖 于 地 区 公 的 电话 号 码 ， 表 现 出 位 置 的 独立 性 。 

universal ordering (通用 排序 ) ”一 种 多 对 多 消息 排序 的 形式 ， 要 求 并 且 保 证 所 有 的 消息 严 
格 按照 发 送 的 顺序 被 接收 。 

update sequence number (更 新 序列 号 ) ”修改 上 日志 中 表示 对 文件 或 目录 进行 特别 修改 的 数 
字 。 

usage point (使 用 点 数 ) ”分 布 式 调度 的 一 个 方法 ， 为 使 用 外 部 资源 的 计算 机 支取 点 数 ， 而 
对 允许 远程 位 置 使 用 其 本 地 资源 的 计算 机 增加 信用 。 

usage table (AR) 集中 式 服 务 器 上 的 一 个 位 置 ， 维 护 分布 式 系统 中 所 有 成 员 运 行 时 使 
用 的 点 数 总 和 。 

very large memory (超大 内 存 ) ”地 址 空间 能 够 支持 64 位 的 地 址 。 

virtual memory (HUA) ”一 个 内 存 管理 的 概念 ， 允 许 进程 相信 其 拥有 自己 所 需要 的 所 
有 内 存 ， 即 使 这 部 分 内 存 的 数量 大 于 实际 的 物理 内 存 。 

voluntary scheduler (自愿 调度 ) 不 强制 分 布 式 系统 中 的 每 个 位 置 都 要 允许 远程 进程 在 本 
地 执行 的 调度 算法 。 分 布 式 调度 中 的 参与 人 员 是 完全 自愿 的 。 

weak consistency model ( 弱 一 致 性 模型 ) ”使 用 同步 变量 的 一 致 性 模型 。 当 使 用 了 同步 变 
量 之 后 ， 所 有 的 本 地 写 操作 都 要 传播 到 整个 系统 ， 而 每 个 位 置 上 的 系统 都 要 更 新 自己 所 
持 有 副本 的 数据 。 

whole file caching (全 文件 高 速 缓存 ) ”一 种 分 布 式 文件 服务 ， 其 中 客户 向 他 们 的 位 置 传输 
文件 的 副本 ， 也 被 称 为 远程 复制 。 
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mapping to COM (映射 到 COM), 148 
messaging (7H. E4738), 147 
object adapter (对 象 适 配器 ) 145 
ORB, 144 
ORB in Chorus (Chorus 中 的 ORB), 135 
portable object adapter (灵活 对 象 适 配器 )， 
145 
critical region (WFK), 105, 108, 
见 concurrency control 
cryptography (加 密 ) 
RSA (三 重 公 钠 加 密 算法 )，266 


D 

Data Encryption Standard (数据 加 密 标 准 )， 
197 

见 DES in NFS 


datagram 《数据 报 )，8，67，69 
in Java, 70 
DCOM, 53, 127, 138, 290 
mapping from CORBA (从 CORBA 的 映射 )， 
148 
deadlock 〈 死 锁 ) 119 
avoid (避免 )，121 
condition (条件 ) 119 
DES (数据 加 密 标准 )，261 
detect (检测) 122 
ignore (Am), 121 
PAID 〈 处 理 死 锁 的 方法 ) 120 
prevent (防止 )，120 
phase 1 《阶段 1), 263 
phase 《阶段 2) 263 
phase (阶段 3), 263 
DES (数据 加 密 标准 ) 
algorithm 〈 算 法 ) 261 
Diffie-Hellman key exchange ( Diffie-Hellman 
键 变换 ) 269 
in NTP, 246 
in Windows (2000), 290 
support for in Windows 2000 (对 Windows 
2000 的 支持 ) 319 
digital signature (数字 签名 ) 265 
digest function (摘要 功能 ) 265 
message digest 《消息 摘要 ) 265 
using public-key encryption (使 用 公共 钥 加 
密 )，270 
directory service (目录 服务 )，90,，97，195 
directory management (目录 管理 )，195 
directory operations (目录 操作 ) ，196 
directory structures (目录 结构 )，195 
in Amoeba, 137 
in NFS, 198 
in Windows 2000, 290, 306 
X.500, 200 
distributed directory (分 布 式 目录 )，90 
Active Directory (743) BH R), 290 





distributed file system 〈 分 布 式 文件 系统 ) 
见 file service 
distributed real-time (分 布 式 实时 )，17 
sample application (采样 录用 )，25 
distributed scheduling (分 布 式 调度 ) 
见 scheduling 
distributed shared memory (分 布 式 共享 内 存 )， 
89，207，222，223，231 
multiple reader/multiple writer (多 读者 /多 写 
者 ) 93 
multiple reader/single writer (多 读者 / 单 写 
者 ) 91, 135 
shared memory (共享 内 存 ) 
single reader/single writer ( 单 读者 / 单 写 
#), 90 
Domain Name Server (域名 服务 器 ) 184 
in Windows 2000, 309 
Domain Name System (RZ RA) 
use in Windows 2000, 306 
domino effect (多 米 诺 现象 ) 231 
DSM 
参见 distributed shared memory (分 布 式 共享 
内 存 ) 


E 
Encrypting File System 〈 加 密 的 文件 系统 ) 
参见 Windows 2000 
encryption 《加密 )，260 
asymmetric cryptography ( 非 对 称 加 密 )， 
265 
DES (数据 加 密 标 准 )，261 
digital signatures (数字 签名 )，265，270 
entry release consistency (AH (条 目 ) Æ 
放 一 致 性 ) 224 
private-key (#499), 261 
public-key (444), 265 
symmetric encryption 〈 对 称 加 密 )，261 
synchronization variables (同步 变量 ) 224 
external data representation (外 部 数据 表示 )， 


43 
fault tolerance (容错 )，242 
in NTP, 246 


F 

fault-tolerant (容错 )，254 

file replication (文件 复制 )，192 

file service (文件 服务 ) 187, 192 
AFS (Andrew 文件 系统 ) 204 
file attribute (文件 属性 ) 188 
file modification notification (文件 修改 要 
点 )，190 
file protection mode (文件 保护 模式 )，188 
file replication (文件 复制 )，192 
file service (文件 服务 ) 207 
file storage (文件 存储 ) 187 
file type (文件 类 型 )，180 
NTFS in Windows 2000 ( Windows 2000 中 的 
NTFS), 303 
reparse points in NTFS (NTFS 中 的 重 解析 
FL), 305 

firewall 《防火 墙 ) 279 
architecture (体系 结构 )，281 
bastion host architecture (设防 宿主 体系 结 
构 )，281 
filtering host architecture 《过 滤 宿 主体 系 结 
构 )，282 
filtering subnet architecture (过 滤 子 网 体系 
结构 ) 283 
packet filering 〈 组 过 滤 )，280 
proxy server (REIRA AF), 281 

Flynn’s taxonomy (Flynn 的 分 类 )，21 


G 
global ordering 〈 全 局 排序 ) 217, 235, 254 
global time (全 局 时 间 ) 216, 217, 235 
drifting (M), 235 
logical clock (逻辑 时 钟 )，236 
Physical clock (物理 时 钟 )，236 
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H 
happen-before relationship (超前 关系 )，250 
Hardware Abstraction Layer in Windows 2000 
(Windows 2000 中 的 硬件 抽象 层 ) 
hash function ( 散 列 函 数 )，186 
heterogeniality ( 非 均 名 性 ， 多 态 性 )，43 
HTTP' 超 文本 传输 协议 ) 

support in Windows 2000, 311 


| 
interconnection network 〈 互 联网 络 ) 
bayan, 23 
Benes, 23 
bus (2%), 20 
crossbar (22M), 21 
hypercube 〈 超 立方 体 )，22 
interprocess communication (进程 间 通 信 )， 
53 
message passing〈 消 息 传输 ) 54 
pipe (管道 ， 流 水 线 )，61 
remote procedure call (远程 过 程 调用 )，72 
selection factor (选择 因子 )，54 
ISO/OSI Reference Model (ISO/OSI 参考 模 
Al), 8, 14 
layer description 〈 层 次 描述 ) 9 
point-to-point layer (点 对 点 分 层 ) 10 
isochronous event (等 时 事件 )，17 


J 
Java, 128 

datagram 《数据 报 )，70 

socket ( 套 接 字 )，69 

Java, 

monitor ( 管 程 )，111 

multithreading support (多 线程 支持 )，37 
JavaOS, 133 


K 
Kerberos, 197, 276, 230 








support for in Windows 2000 ( Windows 2000 
中 的 支持 ) 319 
kernel (内 核 )，31 
in Windows 2000 (Windows 2000 中 ) 293 
layered (40/2), 32 
microkernel (fA), 32 
monolithic (单一 内 核 )，31 
kernel (内 核 )，81 


M 
microkernel ($ 内 核 )，133，293，320， 
323, 324, 325 
参见 Windows 2000 
in Chorus, 134 
Windows 2000 kernel object ( Windows 2000 
内 核对 象 ) 295 


L 
Lamport’ s algorithm (38 RBH), 62, 250, 
254 
lazy release consistency ( tM TH Æ 2k — a), 
224 
LDAP (轻重 量 目录 存放 协议 ) 
参见 active directory in Windows 2000，289 
load balancing ( 仙 载 平衡 ) 
参见 scheduling 
参见 migration 
load distribution (人 负载 分 布 ) 
参见 scheduling 
locks 《封锁 )，112 
参见 concurrency control 
centralized lock manager (集中 式 锁 管理 
器 ) ，115 
distributed lock manager (分 布 式 锁 管 理 
器 ) 116 
happen-before relationship 〈 超 前 关系 )，250 
logical clock (32 #4 #4), 236, 250 
logical ordering (32 #8 HE FF), 251 
lost update 《丢失 恢复 ) 208, 213 
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M 
Mach 
scheduling 【调度 ) 164 
marshalling parameter (整理 参数 )，73 
memory bottleneck (HFMM), 87 
memory management (内 存 管理 )，81 
参见 shared memory 
参见 distributed shared memory 
memory management unit (MMU) (内 存 管理 单 
元 (MMU)), 82 
in Chorus COOL, 134 
in Clouds, 132 
pages (WW), 82 
page replacement algorithms (页 面 置换 算 
法 )，84 
segmentation (分 段 ， 碎 片 ;，82 
thrashing (W8), 85 
memory migration (内 存 迁 移 ) 
concurrent copy《 并 发 复制 )，98 
copy-on-reference (访问 时 复制 )，98 
freeze time 《停顿 时 间 )，98 
stop-and-copy 《停止 和 复制 )，98 
message ordering (消息 排序 )，62 
incidental ordering (随机 排序 )，62 
uniform ordering (均匀 排序 )，62 
universal ordering (通用 排序 )，62 
message passing (消息 传递 ) 32, 54 
blocking primitive〈 阻 塞 原 语 ) 55 
nonblocking 〈 非 阻塞 ) 55 
nonblocking primitive 〈 非 阻塞 原 语 ) 58 
message passing (消息 传递 ) 86, 90 
Microsoft Index Server (MS 索引 服务 器 ) 
参见 Windows 2000 
Microsoft Management Console (MS 管理 控制 
台 ) 
参见 Windows 2000 
midware (中 间 件 ) 15 
migration (迁移 ) 129, 41 
adaptive scheduling assignment ( 自 适 应 调度 


分 派 )，156 
load balancing (负载 均衡 )，41 ，153 
load sharing 《负载 共享 )，41，153 
migration 《迁移 )，88 
memory migration (内 存 迁 移 )，98 
support in Windows 2000 (Windows 2000 x 
fF), 317 
MIMD 《多 指令 流 多 数据 流 )，21 
MISD (多 指令 流 单数 据 流 )，21 
monitors ( 管 程 )，108 
参见 concurrency control 
condition variable (条 件 变 量 )，110 
support in Java (Java 中 支持 ) 111 
multicomputer 〈 多 计算 机 ) 19 
multiprocessors (多 处 理 器 ) 19 
multithreaded (多 线程 ) 
参见 thread 
mutual exclusion (4 FF ) 


参见 concurrency control 


N 
name service (4 ARS), 179 
in Clouds, 131 
in Windows 2000, 308 
in X.500, 201 
name space (名 字 空 间 )，3 
naming (命名 )，131 
Domain Name Server (域名 服务 器 ) 184 
global naming (全 局 命名 ) 181 
IPv4 naming (IPv4 命名 ) 184 
nested transaction) #4), 228 
NetWare (网 件 ) 
support for in Windows 2000 (Windows 2000 
中 支持 )，304，308 


Network File System 《网 络 文件 系统 )，197 


directory service 《目录 服务 )，198 
mounting (#2 #1), 198 

name service (4 FRZ), 199 
network latency 〈 网 络 延 迟 ) 17 
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network system (网 络 系统 )，3 
Network Time Protocol (网 络 时 间 协 议 )，235， 
243 
accuracy of (精确 度 )，254 
architecture (体系 结构 )，244 
authentication (授权 )，246 
data format (数据 格式 )，246 
fault tolerance (容错 ) ，246 
frame format ( 帧 格式 ) 248 
Simple Network Time Protocol (简单 网 络 时 
间 协 议 ) 247 
stratum (Bh), 244 
synchronization mode《 间 步 模 式 ) 247 
balidation test (验证 测试 )，249 
network, 4 
APPN, 14 
ATM, 8 
backbone (EF PY), 4 
bridge (PURE), 4 
datagram 《数据 报 )，& 
Ethernet (IKA), 5 
FDDI, 7 
frame relay (Wi 4K), 8 
interconnection network (互联 网 ) 19 
LAN, 5 
PSTN 〈 公 共 开 关 电 话 网 络 ) ，8 
repeaters (激发 器 ) 4 
router (路 由 器 )， 4 
token ring( 令 牌 环 )，5, 7 
WAN, 8 
wireless (T2), 5,7 
X.25, 14 
NFS 
参见 Network File System 
NORMA architecture (NORMA 体系 结构 ) 19 
NTFS, 321 
参见 Windows 2000 
NUMA architecture (NUMA 体系 结构 )，19， 
45, 82, 86 


O 
object (A), 127, 128 
in Amoeba, 137 
in Clouds, 131 
in Chorus COOL, 133 
in Windows 2000 MMC, 313 
method (方法 )，128 
multiple inheritance (多 重 继 承 )，128 
object adapter (对 和 象 捕 获 器 )，145 
subject-oriented programming (面向 主题 程 
序 设计 )，130 
Object Manager in Windows 2000 ( Windows 
2000 中 的 对 象 管理 器 ) ，298 
Windows 2000 kernel object (Windows 2000 
内 核对 象 ) 295 
orphan process handling 《孤儿 进程 处 理 )，168 
child process allowance〈 子 进程 修正 ) ，171 
orphan cleanup (孤儿 清除 ) 170 
page replacement algorithm 《页面 替换 淘汰 
算法 )，84 
process version numbers 〈 进 程 版 本 号 ) 173 


P 
page scanner 《页 面 扫描 器 )，88 
PAID (处 理 死 锁 的 方法 )，120 
parallel software paradigms 《并 行 软件 范例 )，23 
parallel system (并行 系统 )，19 
peer-to-peer model (HERA), 13 
in NIP, 247 
physical clocks 〈 物 理 时 钟 ) 236 
centralized physical time service (集中 式 物 
理 时 间 服 务 ) 239 
clock skew 《时 钟 偏 移 ) 237 
computer clock (计算 机 时 钟 )，237 
distributed physical time service (分 布 式 物 
理 时 间 服 务 )，242 
Geostationary Operational Environmental Satel- 
lite (地 面 站 操作 环境 卫星 )，236 
Network Time Protocol (网 络 时 间 协 议 )， 
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243 
synchronizing 《同步 )，237 
time provider 《时 间 提 供 者 )，237 
Universal Time Coordinator (宇宙 协同 时 
间 )，236 
use for total ordering 《利用 总 体 排序 )，253 
pipe (管道 )，61 
mkfifo command (Mkfifo 命令 )，64 
mknod command (Mknod 命令 )，64 
named pipe (命名 管道 )，63 
UNIX names pipe (UNIX 4 FEX), 64 
Unnamed pipe 〈 非 命名 管道 )，61 
plug and play 〈 即 揪 即 用 ) 
参见 Windows 2000 
polling (#7), 56, 113, 45, 125 
POSIX, 33, 36 
compliance in Windows 2000 (Windows 2000 
中 的 遵循 )，292 
names pipes (名 字 管 道 )，64 
PRAM consistency (PRAM 一 致 性 )，218，219 
precedence relationship〔 优 先 关 系 )，45，46 
process (进程 )，32 
addressing (ätt), 59 
distributed process management (分 布 进程 管 
理 )，151 
divisible processes (可 分 进程 )，40 
indivisible processes (不 可 分 进程 )，40 
migration 《迁移 )，41 
orphan process handling (孤儿 进程 处 理 )， 
168 
processor allocation (处 理 器 分 配 ) 
JR, scheduling 
process management 《进程 管理 ) 38 
scheduling (BE), 44 
process management 《进程 管理 )，38 
processor consistency (处 理 器 一 致 性 )，219 


R 
race condition (竞争 条 件 )，112 


real-time systems (实时 系统 )，16，133 
distributed real-time (分 布 式 实时 )，17 
embedded real-time (AREXE), 16 
firm real-time (固件 实时 )，16 
hard real-time (硬件 实时 )，16 
reactive real-time 《交互 实时 )，16 
soft real-time ( 软 实时 )，16 
release consistency 《释放 一 致 性 )，222，224 
参见 lazy release consistency (懒惰 (ZER) 一 
致 性 ) 
acquire access 《捕获 访问 )，222 
barrier ( 壁 全 〈 障 碍 )) 222 
protected variable 〈 保 护 变量 ) 223 
release access (释放 访问 ) 222 
remote procedure call RPC, 247 
remote procedure call “远程 过 程 调用 )，72 
binding (#898), 73 
call semantics 《调用 语义 )，75 
data type support (数据 类 型 支持 )，72 
in NFS, 197 
in Windows 2000, 298 
in Windows 2000 cluster service (in Windows 
2000 集群 服务 )，316 
marshalling (整理 )，73 
parameter type (参数 类 型 )，72 
Sun’ s ONC RPC, 76 
reparse points ( 重 解 析 点 ) 
参见 Windows 2000 
retrieval disparity (检索 )，209，213 
routing (路 由 )，182 
RPC 
参见 remote procedure call 
RSA【〈 三 重 公 钥 加 密 算法 ) 266 
in Windows 2000，290 
three phases of (三 相 的 )，268 


S 
scheduling (调度 ) ，44 
参见 precedence relationship 
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gang scheduling (Gang 调度 ) 45 
polled-loop (#7), 45 
scheduler organization (调度 程序 组 织 )，45 
thread scheduling (线程 调度 ) ，37 
Secure Socket Layer (安全 套 接 字 层 ) 
support for in Windows 2000 (在 Win- 
dows2000 中 的 支持 )，319 
security (安全 性 )，129，137，259 
access control list (访问 控制 表 ) ，189 
asymmetric cryptography (不 对 称 加 密 )， 
265 
capability (能 力 )，189 
certificate list (TARJ), 271 
concems in distributed system (涉及 分 布 式 
RH), 270 
Diffie-Hellman key exchange ( Diffie-Hellman 
密 铀 交换 ) 269 
digital signature (数字 签名 ), 265 
distributed access control (分 布 式 存 取 控 
制 )，259 
distributed authentication (分 布 式 授权 )， 
259 
file protection mode 《文件 保护 模式 )，188 
in NTP, 246 
in Windows 2000，292 
in Windows NT, 319 
Kerberos, 276 
RSA cryptography RSA 加 密 ，266 
Security Reference Monitor in Windows 2000 
(Windows 2000 中 的 安全 访问 监控 ) ，298 
semaphore 〈 信 和 号 量 ) 107, 111 
UNIX semaphore support ( UNIX 信和 号 量 支 
持 ) 110 
Security Descriptor Definition Language (安全 描 
述 定 义 语 言 ) 
参见 Windows 2000 
Security Support Provider Interface 
提供 者 界面 
参见 Windows 2000 


安全 支持 





semaphore 《信和 号 量 ) 135 
in Clouds, 132 
semephore object in Windows 2000 ( Windows 
2000 中 的 信号 量 对 象 )，296 
sequential consistency ( 顺序 一 致 性 )，216， 
217，221，224 
shared data 《共享 数据 ) 90 
shared memory (FEF AFF) 32, 86, 111 
false sharing (WI), 97 
参见 distributed shared memory 
SIMD ( 单 指令 流 多 数据 流 ) 21 
Simple Network Time Protocol (简单 网 络 时 间 
协议 )，247 
SISD ( 单 指令 流 单数 据 流 ) ，21 
snoopy cache 〈 窃 听 式 高 速 缓存 )，88，89 
socket 〈 套 接 字 ) ，63 
Java socket (Java BHF), 69 
socket (EHF) 
SSL《〈 安 全 套 接 字 层 ) 276 
UNIX socket (UNIX 套 接 字 ) 65 
Solaris, 76 l 
SSL, 276 
stochastic leaming (随机 学 习 )，165 
strict consistency (严格 一 致 性 )，216，217 
subject-oriented programming (面向 主题 程序 
设计 )，130 
supercomputer (超级 计算 机 )，19 
synchronization (同步 )，235 
synchronous event (同步 事件 )，17 
synchronization variable (同步 变量 )，220， 
224 


T 
task interaction graph (任务 交互 图 )，40 
TCP/IP, 8, 11, 67, 69 

in NIP (网 络 时 间 协 议 )，248 

IP addressing (IP 编 址 )，183 

IP routing (IP BRT), 182 

IPv4 name resolution (IPv4 % F), 184 
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security issue (安全 状况 ) 281 
telecommunication (远程 通信 )，25 
thrashing ( 颠 艇 )，85 
distributed 《分布 式 )，97 
threads 《线程 )，295 
client/server paradigm (C/S 7738), 34 
in Chorus, 135 
in Clouds, 131 
Java, 37 
kernel support (A KH), 37 
multithreaded paradigm (多 线程 范例 )，34 
POSIX, 36 
specialist paradigm 〈 专 用 程序 范例 ) ，34 
user-space support 〈 用 户 空间 支持 ) 38 
three-point test (三 点 测试 ) 106 
time service (时 间 服 务 )，239 
centralized physical time service 《集中 式 物 
理 时 间 服 务 ) 239 
distributed physical time service (分 布 式 物 
BRAY (EARS), 242 
logical clock (G2 48 Rt ##) , 250 
Network Time Protocol (网 络 时 间 协 议 )， 
243 
timestamp (FĦEJÆR), 117, 121 
counter based (基于 计数 器 ) 253 
in Windows 2000 change journal ( Windows 
2000 改变 日 志 )，311 
NTP fomat (NTP 格式 )，246 
the use of in NIP (NTP 中 的 使 用 ) 249 
types in NTP (NTP 中 的 类 型 ) 249 
use for global time (使 用 全 局 时 间 ) 236 
use for total ordering (使 用 整体 排序 ) 253 
token passing algorithm 〈 令 牌 传输 算法 ) 118 
total ordering (整体 排序 ) 254 
transaction management (事务 管理 )，175， 
207 
参见 ACID property (ACID 特性 )，213，228， 
230 
compound transaction (8 47334), 228 


domino effect (4 KiB HR), 231 
lost update (KKE), 208, 213 
nested transaction (WE), 228, 229 
premature read (Fi), 230 
premature write (M5), 230 
retrieval disparity〈 恢 复 不 一 致 ) 209, 213 
rollback (EHX), 228 
two-phase commit (两 阶段 提交 ) 224 
transaction ($4 ) 
参见 Transaction management 
transparency (3@FAPE), 15 
access transparency 《访问 透明 性 )，15 
concurrency transparency 《并 发 透明 性 )，16 
failure transparency (故障 透明 性 )，16 
location (位 置 )，181，182 
location transparency (位 置 透 明 性 )，15S， 
131 
migration transparency 《迁移 透明 性 )，15 
参见 migration 
name (和 名字 )，181 
name transparency (名 字 透 明 性 )，15， 
131, 134 
parallelism transparency 《并 行 透明 性 )，16 
replication transparency (A fil HATE), 16, 
192 
two-phase commit protocol (两 阶段 提交 协议 )， 
224 
commit phase 《提交 点 )，227，230，231 
prepare to commit phase (准备 到 提交 点 )， 
225, 229 
rollback (HR), 227 


U 
UDP (用 户 数据 报 协议 )，67 

in NTP, 248 
UMA architecture (UMA 结构 ) 19, 85 
Universal Time Coordinator (调整 国际 标准 
时 ) 236 
UNIX, 67, 127, 138 
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V 


directory structure (目录 结构 )，195 
firewall issue 《防火 墙 概 况 )，280 
names pipe 《名字 管 道 )，64 

pipe 《管道 ， 流 水 线 )，61 

POSIX thread (POSIX 线程 )，36 
semaphore support 〈 信 号 量 支持 ) 110 
shared memory (共享 内 存 )，87 
socket ( 套 接 字 )，65 

Solaris, 76 

time service 《时 间 服 务 )，240 


Very Large Memory (海量 内 存 ) 


参 


见 Windows 2000 


virtual memory (MAF), 82, 86, 98 


W 
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